[样本量计算]样本量计算的四重境界

01-19

我们撰写标书/研究计划/开题报告常常都涉及到样本量计算的问题，介于很多读者都有此类需求，小编打算另开一个《样本量计算：从入门到进阶》的主题系列。这个[样本量计算]的系列，就带着大家从入门到进阶，实现一下常见样本量的计算。

该系列中涉及到需要采用软件来辅助/示例时，将采用样本量计算界最有名的PASS：

正如上图中PASS自己宣称的那样，它是最好用的样本量计算工具！

但如果你事先对于样本量计算的基础知识了解不够，那你下载到了这个软件也白搭，因为里面的专业术语太多，逻辑性太强~~几乎所有“好用”的样本量计算软件都是这样——样本量计算本身就是一门大学问！就像小编之前在《统计软件操作学习指南》中提到过的：“一切不以坚实统计知识为基础的统计操作都是耍流氓！”（查阅关键词“软件”）

那么对样本量的学习掌握，都需要哪些知识？本文从四重境界进行展开：

入门

进阶

独孤求败

高处不胜寒

1. 入门

我想目前在做生物医学研究的人大多数都是处在入门与不入门之间。

所谓入门，即能够初步理解国内经典教材（其实就是那些个《医学统计学》s）上提到的影响样本量的几大要素，即α、β、δ、和SD等，并知道/可随时查阅到对应研究设计类型的样本量求解公式。

所谓不入门，那就是~~老师没讲过？讲过没听懂？听懂没记住？记住又忘了？^_^

2. 进阶-看山是山，看水是水

关于进阶，小编在构思这个[样本量计算]系列时，反复思考：如何清楚明白地让读者学习掌握样本量计算？真的好难啊~！

所以，本来这篇文章的题目是《样本量计算的前置知识》，现在改成了《四重境界》的导入语。因为小编觉得，真正透彻理解样本量计算，并不是一篇文章可以表达清楚的，至少需要一个系列，从基本概念入手，由浅入深，层层深入方可。基础不牢，地动山摇！

小编，处于进阶的境界，大概需要对以下概念有着透彻的理解，后期小编会将这些小主题写成一篇篇小文供大家参考，莫急~：

2.1 分布、标准差、标准误

做所有统计分析之前，都要先看分布，这个很多人都会忽略掉。不是t分布，就不能用t检验，就这么简单。但也没那么简单，天下的分布千千万，千万种分布，如何描述；千万种检验，如何选择？

标准差（SD）、标准误（SE，SEM），这是进行样本量计算所需的最最基本的概念。做统计久了，这两个概念基本上已经化作一个概念了——以样本量做杠杆，可随时进行转换。但对于新人，一定要理解到，标准差是对总体分布离散特征的描述；标准误是对总体均值的描述！两者有截然不同的意义！说了是“理解”，不是“背上来”填到考卷上。。。

下图中，如果两条曲线都是来源于同一组数据，哪条是用标准差描述的？哪条是用标准误描述的？

答案是酱紫滴~↓~你答对了吗？

答对了的，恭喜哦！当然，想不起来也没关系，关注小号后续文章，小编会有更详细的讲解！

2.2 假设检验理论

很多人做统计，上来就做卡方、做T，都忽略了统计学最最根本的前提：统计假设！

理解样本量计算这种高端的知识体系，假设检验的基本理论是必备的！大家思考回忆一下：

什么是H0？

什么是H1？

什么是一类错误？

什么是二类错误？

什么又是Power？

是不是了然于心，都很纯熟了呀？你能在下图中将其一一指出吗？

小编亲手绘制的图片，不算太难看吧？

答案是酱紫滴~↓~你答对了吗？

答对了的，恭喜哦！当然，想不起来也没关系，关注小号后续文章，小编会有更详细的讲解。恩~让这组图动起来~！^_^

2.3 研究设计

不同研究设计类型，对应的不同的研究假设。这里的假设，比上面的H0有更丰富的内涵。研究设计是先于统计分析的一个重要的科研活动构成要素。万不可轻视！这也是为什么小编在《有这样一门学科，叫做流行病学》中说流行病学比统计更重要的原因。（查阅关键词“流行病学”）

拿我们临床试验来说吧，常见的有差异性检验、优效、等效、非劣等等。差异性检验与普通的假设检验差不多，但非劣（举例来说），是证明不低于之前设定的某一个下限值！全然不同的统计思路。

更有交叉设计、序贯设计、期中分析等等各色不同的设计类型（提到的这几个设计的分类角度都是完全不同的），都对应着各自不同的样本量估算方法！掌握了各种研究设计类型，才算有了是样本量计算“进阶”这一境界的基础。

2.4 软件

之前说过的，“一切不以坚实统计知识为基础的统计操作都是耍流氓！”

但我们现在已经有了前述的诸多知识储备，再打开软件，那就是“看山是山，看水是水”的境界了。

虽如此，本系列文章中，还是会以PASS软件为例，简单介绍我们常用到的几种样本量计算的软件操作。当然，你也可以使用其他的软件——原理是相通的，操作也是相通的！

PASS：

3. 独孤求败

独孤求败的内容，就不在[样本量计算]的系列文章中呈现给大家了。毕竟难度太高、适用的场合又很少。但却不妨碍我简单提一下独孤求败的境界到底是什么样子的！

有人可能会想，独孤求败，这么厉害，肯定有很好的数理统计基础了吧？来计算推导样本量计算公式？非也~非也~

很多情况下，最简单的就是最复杂的~频率学派和贝叶斯学派，都分别对应一件大规模杀伤性武器：

频率学派：Bootstrap

贝叶斯学派：MCMC

一个是重抽样，一个是数据的链式生成。基本上绝大多数统计问题，这两派的学者都可以用这类方式求得结果！搞定样本量估计，也不过是个把钟头的事儿~（这里之所以不敢用“分分钟”，是因为这两类算法真的很耗时间……）

太深奥，有兴趣的朋友不妨百度之~谷歌之~

下图，一个典型的MC过程：

4. 高处不胜寒

4.1 临床医生的高处不胜寒：

小编在《[强力推荐]很全面的样本量计算软件整理》一文中提到过：样本量最大的限制因素，其实并不是我们常说的α、β、δ、和SD那些东西，而是经费！（查阅关键词“样本量”，有彩蛋）

既然提到了经费~那大家都懂的。

4.2 统计学家的高处不胜寒：

很多临床医生非常认可统计学家的作用，撰写标书课题，经常来咨询统计学家，“帮我算个样本量吧”，也很懂行地介绍自己的设计，“我做的是……巴拉巴拉……”，并且也知道统计学家都很忙，“也不急，这几天给我就行了”。

但样本量计算真的不是统计学家自己就可以完成的哦！你有没有瞅见统计学家眼中含着的泪水~？贴段话，大家就明白了！

截取自NEJM一篇文章的Supplementary Appendix：

Sample size was based on meta-analyses of previous clinical studies. To derive an assumption about ……, nine trials using the same definition of …… were analyzed.

统计学家，卒！

4.3 小编的高处不胜寒：

小编辛辛苦苦修炼样本量计算大法，总算打通奇经八脉。上几天出于热心帮本号一位读者计算了样本量~

第一组----免费！第二组又来，有完没完啊？发个红包先！

——好配合啊，直接就发过来了，激动、兴奋、忐忑，红包到底多大呢~！

5元！

我倒~！平均每算一组两块五~！菜市场买菜呢？小编默默告诫自己，绝不让这类事情发生第二次！TAT

期待小编新的系列《样本量计算：从入门到进阶》，赶紧转发本文呀，据说，小编经常因为转发量不够拖稿的哦~！

看在小编辛苦撰写的份上~客官们赏一点吧！^_^

与《[样本量计算]样本量计算的四重境界》相关的范文

06-11 区县住户调查统计工作方案

　　根据全面建设小康社会和加快推进社会主义现代化的要求，为更加准确、客观、真实地反映我市区县居民收支情况和生活质量，满足市委、市政府和区县在“富民强市、两个率先”战略目标进程中的监测考核需要，特制定本工作方案。　　一、目的和意义　　坚持以人为本，把富民摆在更加突出的地位，是贯彻落实“三个代表”重要思想和科学发展观的重要体现。开展住户调查取得分区县的住户调查资料，是区县党委和政府了解民情民意、分 ...

06-29 高一数学下学期教学计划

一、指导思想：使学生在九年义务教育数学课程的基础上，进一步提高作为未来公民所必要的数学素养，以满足个人发展与社会进步的需要。具体目标如下。 1．获得必要的数学基础知识和基本技能，理解基本的数学概念、数学结论的本质，了解概念、结论等产生的背景、应用，体会其中所蕴涵的数学思想和方法，以及它们在后续学习中的作用。通过不同形式的自主学习、探究活动，体验数学发现和创造的历程。 2．提高空间想像、抽象概括、 ...

07-29 高一数学下学期教学计划2

04-02 生产实习报告样本

　　本次实习以生产实习为主，生产实习是学习工业工程专业的一项重要的实践性教学环节，旨在开拓我们的视野，增强专业意识，巩固和理解专业课程。实习方式主要是请企业技术管理和企业管理人员以讲座形式介绍有关内容；同学们下生产车间参观，向企业的现场管理，技术生产工作人员学习请教相关知识；由带队老师组织同学们分组讨论、发言，通过交流实习体会方式，加深巩固实习和专题讲座内容。通过本次实习，我们学到了很多课本上学不 ...

10-23 OEM买卖合同

买方：（下称甲方）地址：邮编：＿＿＿＿＿电话：传真：卖方：（下称乙方）地址：邮编：＿＿＿＿＿电话：传真：商标提供方: 地址: 电话:传真：甲乙双方经充分协商，本着自愿及平等互利的原则，订立本合同。第一条名称、品种、规格和质量 1.名称、品种、规格、颜色、运输包装方式（如SkD，cBU，ckD等）：公司作为商标的所有者,提供商标的使用权用于第二条第1款规定数量的产品生产. 2.质量 ...

10-23 貨物买卖合同

买方：（下称甲方）地址：邮编：__ 电话：传真：__ 电子邮箱：卖方：（下称乙方）地址：邮编：__ 电话：传真：__ 电子邮箱：甲乙双方经充分协商，本着自愿及平等互利的原则，订立本合同。第一条名称、品种、规格和质量 1.名称、品种、规格： (应注明产品的牌号或商标)。 2.质量，按下列第()项执行： (1)按照__标准执行(须注明按国家标准或部颁或企业具体标准，如标准代号、编号和标准名称 ...

02-06 最新劳动合同书样本范文

最新劳动合同书样本范文劳动合同书合同编号：______________ 甲方（用人单位）名称___________________________________________________ 法定代表人_______________________________________________________________ 住所地____________________________ ...

05-01 职院生源扩招推广方案

职院生源扩招推广方案序言近年随着国家政策鼓励提高国民整体的素质，各大高校积极响应，扩大生源这一举措也得到深入发展。市场需求的不断变化，各大院校根据不同的需求调整了各自的品牌专业以及扩大生源的招生比例。由于社会分工日益明显，新的需求动态变化，新的专业设立成为各大高校竞争生源的重点。中国电信旗下的实业--xx职业技术学院，成立于1959年，并且多次和xx邮电学院合作开设了特色专业，迎合了市场的需 ...

10-19 工程项目劳务合同样本

第一部分协议书劳务使用方：（以下简称甲方）劳务提供方：甲方在高速公路合同段工程项目TRANBBS施工，经过对乙方资格审查，同意将部分劳务工程的劳务作业委托给乙方，为确保工程顺利进行，明确双方在施工过程中的权利、义务和经济责任，根据<中华人民共和国合同法〉及其他相关法律，双方本着平等诚信、自愿的原则，经充分协商一致，于20XX年月在签定本合同，双方共同遵守。 1、劳物作业概 ...

11-14 二年级数学试卷分析

二年级数学试卷分析一、基本情况： 20XX年秋期期末考试，我镇实行学生单人单桌（前后、左右距离不少于70厘米，每个试室不超过40人，各学校交叉监考。各校的教导主任为主考。试卷装订一般20份一本（至少有五间学校的试卷），统一编码，集中到中心小学进行流水评卷。从试卷收发、考试、评卷到登分、统分，都是十分严格的。本次期末考试，二年级数学科考生人数为人，参考率为100，总分，平均分为分，及格率人数 ...

[样本量计算]样本量计算的四重境界

·校卫队的职责

·2014七夕情人节怎么过才有意义浪漫

·中国人如何在生活里践行我们的文化自信?

·国际公法期末试题汇总(2013--2015按章节)(1)

·椭圆的离心率

·关心教职工生活的实施意见

·研究生教学实践考核表

·农村财务管理讲义

·读[青海高原一株柳]有感

·大一学生入党申请书入党申请书

·学校德育工作计划

·2011年工业和信息化局工作总结

·通用班主任工作总结800字

·我的朋友五年级作文

·家长学校校长职责

·托达罗模型

·每个女孩都是天使

·陈涉世家教学反思

·班级风采展示

·寝室风采大赛通讯稿

[样本量计算]样本量计算的四重境界

与《[样本量计算]样本量计算的四重境界》相关的范文

·校卫队的职责

·2014七夕情人节怎么过才有意义浪漫

·中国人如何在生活里践行我们的文化自信?

·国际公法期末试题汇总(2013--2015按章节)(1)

·椭圆的离心率

·关心教职工生活的实施意见

·研究生教学实践考核表

·农村财务管理讲义

·读[青海高原一株柳]有感

·大一学生入党申请书入党申请书

·学校德育工作计划

·2011年工业和信息化局工作总结

·通用班主任工作总结800字

·我的朋友五年级作文

·家长学校校长职责

·托达罗模型

·每个女孩都是天使

·陈涉世家 教学反思

·班级风采展示

·寝室风采大赛通讯稿

·陈涉世家教学反思