一、研究背景

近年来,社交媒体的使用已成为大学生日常生活的重要组成部分。然而,其对睡眠质量的影响仍存在争议。本研究以“社交媒体使用频率对大学生睡眠质量的影响”为核心问题,基于问卷数据开展实证分析。

研究假设:

  • H₁:大学生社交媒体使用频率越高,睡眠质量越差;

  • H₂:睡前使用社交媒体时间越长,入睡时间越晚;

  • H₃:性别在“使用频率 → 睡眠质量”的路径中起调节作用。

问卷核心变量(共150人样本)

变量名称

类型

描述

性别

分类型

男 / 女

每日使用频率

数值型

每日打开社交媒体次数

睡前使用时长

数值型

每天睡前使用社交媒体的分钟数

睡眠质量评分

数值型

自评1-10分,分数越高睡眠越好

每日入睡时间

时间型

HH:MM格式,例如“23:45”

二、实操步骤 步骤一:数据导入与结构确认

提示词

“我上传了一份关于大学生社交媒体使用与睡眠关系的问卷数据Excel,请检查数据结构是否存在缺失值、不一致的格式或分类混乱。”

DeepSeek返回

  • “睡前使用时长”中有3条负值记录(应为逻辑错误);

  • “入睡时间”格式部分为文本字符串,建议统一转换为时间格式;

  • “性别”列出现“female”“女”“F”混用,建议统一为“女/男”。

继续提示:

“请将性别分类统一为‘男’‘女’,将负值剔除,并转换‘入睡时间’为标准24小时格式。”

DeepSeek输出清洗后的数据下载链接,并报告完成的数据质量审查。

步骤二:描述性统计分析

提示词

“请对各变量进行描述性统计分析,包含平均值、标准差、极差、偏度、峰度和频率分布。”

DeepSeek返回摘要示例

变量

平均值

标准差

偏度

峰度

每日使用频率

8.2次

2.5

0.33

-0.6

睡前使用时长

46分钟

20.4

1.12

2.8

睡眠质量评分

6.1分

1.8

-0.7

进一步提示

“请用学术论文风格撰写一段关于描述性统计结果的文字分析,适合用于‘样本描述’章节。”

AI输出

“调查结果显示,大学生平均每日打开社交媒体约8.2次,睡前使用时间约为46分钟。睡眠质量评分平均为6.1分,表明整体处于中等偏低水平。偏度和峰度数据显示,‘睡前使用时长’呈正偏态分布,且存在一定尖峰,提示部分个体存在高频使用行为。”
步骤三:假设检验与显著性分析

假设1(H₁):使用频率影响睡眠质量

提示词:

“请基于Pearson相关性检验,评估每日使用频率与睡眠质量评分之间的相关关系。”

返回结果:

  • 相关系数 r = -0.52,p < 0.01

  • 存在中等强度负相关,显著

假设2(H₂):睡前使用时间影响入睡时间

提示词:

“请将睡前使用时长与入睡时间进行Spearman相关性检验,并解释是否显著。”

返回结果:

  • ρ = +0.61,p < 0.001

  • 深度解释:“睡前使用时间越长,入睡时间越晚,显著性较高”

假设3(H₃):性别是否调节使用频率与睡眠质量关系

提示词:

“请以‘睡眠质量评分’为因变量,‘每日使用频率’为自变量,‘性别’为调节变量,进行调节效应回归分析,并输出交互项结果。”

返回结果:

  • 交互项β = -0.27,p = 0.032,显著;

  • DeepSeek解释:“在女性群体中,使用频率对睡眠质量的负面影响更显著。”

步骤四:数据可视化生成

提示词

“请生成一张散点图,展示每日使用频率与睡眠质量评分之间的负相关关系,并添加回归线。”

DeepSeek返回:

  • Matplotlib代码(或Excel绘图步骤);

  • 图标题建议:“社交媒体使用频率与大学生睡眠质量的关系图”;

  • 可附自动生成的论文描述段落,用于插图说明。

步骤五:异常值检测与处理

提示词

“请使用IQR方法判断睡前使用时长中的异常值,并指出处理建议。”

返回结果:

  • Q1 = 30,Q3 = 60,IQR = 30;

  • 上限 = 105,下限 = -15;

  • 出现2条高于105分钟的极端值,建议视为异常剔除;

  • DeepSeek同时提供论文中可用的分析描述段落:

“根据IQR方法,共识别出2条显著偏离的极端高值,代表个别学生在睡前社交媒体使用超过105分钟。为避免对分析造成偏差,本研究将其作为异常值处理。”
小结

通过本节案例可以看出,DeepSeek在数据分析流程中的每一步——从数据清洗、描述统计、假设检验、回归建模、图表生成到异常值处理——都能为研究者提供准确、标准、可复用的支持。更重要的是,借助自然语言交互,研究者无需精通统计工具或编程知识,也可以获得论文可用级别的分析结果与写作语言。

本案例强调的并非“自动化替代”,而是AI+人类的写作协同:研究者用洞察提出问题,AI用算力提供答案。未来的数据分析,已不再是门槛,而是路径清晰、落地高效的知识跃迁之路。