创新思维训练营:科研中的统计分析陷阱

2023-10-26 626

1025日中午,教学发展中心学习能力提升之创新思维训练营在陈瑞球楼505成功举办,生物医学工程学院的童善保教授为来自全校各个学院的近50名学生和青年老师带来了“科研中的统计分析陷阱”的主题分享。

 

童老师从“零假设显著性检验和p值、常见的p-hacking问题、相关性分析陷阱和学术论文中的Harking问题”四个方面进行了分享。

 

在第一部分,童老师介绍了关于零假设显著性检验和p值常见错误解释和应用。他认为p值理论是指在H0成立的情况下观测样本数据以及更极端情况的概论,它反映的是样本与H0的兼容性,但并没有告诉我们希望知道的结果,即H0是否成立的概率,特别地,p=0.05本身并不具备可重复性。

在第二部分,童老师介绍了常见的P-hacking行为,比如根据结果来决定是否增加样本量,剔除“异常值”, 更换不同的变量检测,对变量进行变换等等。童老师认为P-hacking 的共同特点是通过各种方法寻求获得显著性的p值,在最终的论文中隐瞒之前得到的不显著的结果。

在第三部分,童老师介绍了相关分析的三个常见问题,即将相关性解释为因果性、将相关系数的p值解释成相关性强弱,以及用非独立观测值计算相关系数等。

在第四部分,童老师介绍了学术论文中存在的HARKinghypothesizing after the results are known)问题,即“在结果已知后提出假设”这一现象。他认为HARKing会导致更多的假阳性发现,并建议同学们分清寻找假设的探索性研究(exploratory study)和假设驱动的验证性研究(confirmatory study),以避免HARKing的问题。

 

本次讲座内丰富、童老师分享了大量生动的科研案例,引导学生们在科研中正确使用统计分析方法和解释数据分析结果。

 

撰稿:肖盛鹏

  修改:谢艳梅

审核:王力娟

摄影:庞