[样本量计算]样本量计算的四重境界
我们撰写 标书/研究计划/开题报告 常常都涉及到样本量计算的问题,介于很多读者都有此类需求,小编打算另开一个《样本量计算:从入门到进阶》的主题系列。这个[样本量计算]的系列,就带着大家从入门到进阶,实现一下常见样本量的计算。
该系列中涉及到需要采用软件来辅助/示例时,将采用样本量计算界最有名的PASS:
正如上图中PASS自己宣称的那样,它是最好用的样本量计算工具!
但如果你事先对于样本量计算的基础知识了解不够,那你下载到了这个软件也白搭,因为里面的专业术语太多,逻辑性太强~~几乎所有“好用”的样本量计算软件都是这样——样本量计算本身就是一门大学问!就像小编之前在《统计软件操作学习指南》中提到过的:“一切不以坚实统计知识为基础的统计操作都是耍流氓!”(查阅关键词“软件”)
那么对样本量的学习掌握,都需要哪些知识?本文从四重境界进行展开:
入门
进阶
独孤求败
高处不胜寒
1. 入门
我想目前在做生物医学研究的人大多数都是处在 入门 与 不入门 之间。
所谓入门,即能够初步理解国内经典教材(其实就是那些个《医学统计学》s)上提到的影响样本量的几大要素,即α、β、δ、和SD等,并知道/可随时查阅到对应研究设计类型的样本量求解公式。
所谓不入门,那就是~~老师没讲过?讲过没听懂?听懂没记住?记住又忘了?^_^
2. 进阶-看山是山,看水是水
关于进阶,小编在构思这个[样本量计算]系列时,反复思考:如何清楚明白地让读者学习掌握样本量计算?真的好难啊~!
所以,本来这篇文章的题目是《样本量计算的前置知识》,现在改成了《四重境界》的导入语。因为小编觉得,真正透彻理解样本量计算,并不是一篇文章可以表达清楚的,至少需要一个系列,从基本概念入手,由浅入深,层层深入方可。基础不牢,地动山摇!
小编,处于进阶的境界,大概需要对以下概念有着透彻的理解,后期小编会将这些小主题写成一篇篇小文供大家参考,莫急~:
2.1 分布、标准差、标准误
做所有统计分析之前,都要先看分布,这个很多人都会忽略掉。不是t分布,就不能用t检验,就这么简单。但也没那么简单,天下的分布千千万,千万种分布,如何描述;千万种检验,如何选择?
标准差(SD)、标准误(SE,SEM),这是进行样本量计算所需的最最基本的概念。做统计久了,这两个概念基本上已经化作一个概念了——以样本量做杠杆,可随时进行转换。但对于新人,一定要理解到,标准差是对总体分布离散特征的描述;标准误是对总体均值的描述!两者有截然不同的意义!说了是“理解”,不是“背上来”填到考卷上。。。
下图中,如果两条曲线都是来源于同一组数据,哪条是用标准差描述的?哪条是用标准误描述的?
答案是酱紫滴~↓~你答对了吗?
答对了的,恭喜哦!当然,想不起来也没关系,关注小号后续文章,小编会有更详细的讲解!
2.2 假设检验理论
很多人做统计,上来就做卡方、做T,都忽略了统计学最最根本的前提:统计假设!
理解样本量计算这种高端的知识体系,假设检验的基本理论是必备的!大家思考回忆一下:
什么是H0?
什么是H1?
什么是一类错误?
什么是二类错误?
什么又是Power?
是不是了然于心,都很纯熟了呀?你能在下图中将其一一指出吗?
小编亲手绘制的图片,不算太难看吧?
答案是酱紫滴~↓~你答对了吗?
答对了的,恭喜哦!当然,想不起来也没关系,关注小号后续文章,小编会有更详细的讲解。恩~让这组图动起来~!^_^
2.3 研究设计
不同研究设计类型,对应的不同的研究假设。这里的假设,比上面的H0有更丰富的内涵。研究设计是先于统计分析的一个重要的科研活动构成要素。万不可轻视!这也是为什么小编在《有这样一门学科,叫做流行病学》中说流行病学比统计更重要的原因。(查阅关键词“流行病学”)
拿我们临床试验来说吧,常见的有差异性检验、优效、等效、非劣等等。差异性检验与普通的假设检验差不多,但非劣(举例来说),是证明不低于之前设定的某一个下限值!全然不同的统计思路。
更有交叉设计、序贯设计、期中分析等等各色不同的设计类型(提到的这几个设计的分类角度都是完全不同的),都对应着各自不同的样本量估算方法!掌握了各种研究设计类型,才算有了是样本量计算“进阶”这一境界的基础。
2.4 软件
之前说过的,“一切不以坚实统计知识为基础的统计操作都是耍流氓!”
但我们现在已经有了前述的诸多知识储备,再打开软件,那就是“看山是山,看水是水”的境界了。
虽如此,本系列文章中,还是会以PASS软件为例,简单介绍我们常用到的几种样本量计算的软件操作。当然,你也可以使用其他的软件——原理是相通的,操作也是相通的!
PASS:
3. 独孤求败
独孤求败的内容,就不在[样本量计算]的系列文章中呈现给大家了。毕竟难度太高、适用的场合又很少。但却不妨碍我简单提一下独孤求败的境界到底是什么样子的!
有人可能会想,独孤求败,这么厉害,肯定有很好的数理统计基础了吧?来计算推导样本量计算公式?非也~非也~
很多情况下,最简单的就是最复杂的~频率学派和贝叶斯学派,都分别对应一件大规模杀伤性武器:
频率学派:Bootstrap
贝叶斯学派:MCMC
一个是重抽样,一个是数据的链式生成。基本上绝大多数统计问题,这两派的学者都可以用这类方式求得结果!搞定样本量估计,也不过是个把钟头的事儿~(这里之所以不敢用“分分钟”,是因为这两类算法真的很耗时间……)
太深奥,有兴趣的朋友不妨百度之~谷歌之~
下图,一个典型的MC过程:
4. 高处不胜寒
4.1 临床医生的高处不胜寒:
小编在《[强力推荐]很全面的样本量计算软件整理》一文中提到过:样本量最大的限制因素,其实并不是我们常说的α、β、δ、和SD那些东西,而是经费!(查阅关键词“样本量”,有彩蛋)
既然提到了经费~那大家都懂的。
4.2 统计学家的高处不胜寒:
很多临床医生非常认可统计学家的作用,撰写标书课题,经常来咨询统计学家,“帮我算个样本量吧”,也很懂行地介绍自己的设计,“我做的是……巴拉巴拉……”,并且也知道统计学家都很忙,“也不急,这几天给我就行了”。
但样本量计算真的不是统计学家自己就可以完成的哦!你有没有瞅见统计学家眼中含着的泪水~?贴段话,大家就明白了!
截取自NEJM一篇文章的Supplementary Appendix:
Sample size was based on meta-analyses of previous clinical studies. To derive an assumption about ……, nine trials using the same definition of …… were analyzed.
统计学家,卒!
4.3 小编的高处不胜寒:
小编辛辛苦苦修炼样本量计算大法,总算打通奇经八脉。上几天出于热心帮本号一位读者计算了样本量~
第一组----免费!第二组又来,有完没完啊?发个红包先!
——好配合啊,直接就发过来了,激动、兴奋、忐忑,红包到底多大呢~!
5元!
我倒~!平均每算一组两块五~!菜市场买菜呢?小编默默告诫自己,绝不让这类事情发生第二次!TAT
期待小编新的系列《样本量计算:从入门到进阶》,赶紧转发本文呀,据说,小编经常因为转发量不够拖稿的哦~!
看在小编辛苦撰写的份上~客官们赏一点吧!^_^