统计学符号有关问题的探讨
・553・
统计学符号有关问题的探讨
华中科技大学同济医学院公共卫生学院流行病与卫生统计学系(430030) 宇传华 钟文明
统计学中涉及到很多的数学符号, 不同的符号有不同的含义。为了便于理解国内、外统计学书籍和杂志中的有关内容, 正确使用、规范书写统计学符号, 下面列举几点我们使用统计学符号的体会。
11统计学符号及其意义
希腊字母
小写
[***********][***********][1**********]
统计学指标分为总体参数和样本统计量, 一般情况下, 总体参数采用希腊字母表示, 比如总体均数μ、总体标准差σ、总体率π; 而样本统计量采用英文字母表示, 比如样本均数 x 、样本标准差s 、样本率p , 具体参见表1。
英文字母小写
beta chi delta epsilon phi phi gamma eta iota kappa lamda mu nu omicron pi pi theta theta Rho sigma final sigma tau upsilon omega xi psi zeta
a b c d e f j g h i k l m n o p v q J r s V t u w x y z
表1 各种符号的书写、发音、及其统计学含义
编号
α(总体截距、Ⅰ类错误概率)
β(总体回归系数、Ⅱ类错误概率) χ(卡方符号)
δ(ε(总体残差)
κ(总体一致性K appa 值) λ
μ(总体均数) υ(自由度) ο
π(总体率) θ
;
ρ(总体相关系数) σ(总体标准差)
S
大写
A 大写
A B C D E F G H I K L M N O P Q R S T U W X Y Z
ΧΕ
Φ(正态分布的面积值) Γ(伽玛函数) ΗΙΚΛΜΝΟ
Π(连乘积符号) Θ
Ρ
Σ(求和符号) ΤΥΩΞΨΖ
τνωξΨζ
在表1中罗列出了20多个希腊字母的大小写、发音、统计学含义, 以及相应的英文字母大小写。28个小写希腊字母分别对应26个小写英文字母和2个大写英文字母(其中希腊字母S 对应于英文字母V , 希腊字母; 对应于英文字母J ) 。
使用统计学符号常见的错误有:①用υ(读up 2silon ) 代替ν(读nu , 自由度) 。将总体参数符号与样本统计量符号混用, 如用β表示由样本数据获得的总体回归估计值(正确的书写应该是b 或者
β^) 。③单双侧
标注错误, 如将t 、z 假设检验的双侧界值符号错误书写为t α, ν、z α(这是单侧界值, 双侧界值符号正确的书写应该是t α/2, ν、z α/2) , 或将置信区间的置信度书写为
(1-α/2) 或100(1-α/2) %, (无论单双侧, 置信度正
) 或100(1-α) %) 。④z 检验确的书写应该是(1-α
通常书写为u 检验, 但常用统计软件和国外文献所指
的U 检验通常是Mann -Whitney U 检验。
21产生统计学符号的方法
产生表1中的希腊字母可以采用两种方法, 即采
・
554・用数学公式编辑器和采用微软Office Symbol 字体:
(1) 数学公式编辑器
微软Office 软件(包括Word 、Excel 、PowerPoint 等) 中带有数学公式编辑器, 基本上可以满足数学符号编辑的需要。使用时可点击菜单“插入→对象(O ) →MicroSoft 公式3. 0”, 获得所需要的符号。为了方便经常使用, 可点击菜单“工具→自定义(C ) →命令→插
n -1-p n -1-p
式中p 为自变量(或解释变量) 的个数, n 为观察例
s y , x =M S 残差=
=
数。
表2 统计学中的一些常用缩写
缩写
ANOVA CL CI CV CRD df G LM LSD MANOVA ML E NS -P Q -Q plot RCB or RCBD RCTs RMSE R 2SD SE SEM SN K SS
英文名称
analysis of variance confidence limit Confidence interval coefficient of variation completely randomized design degree of freedom general linear model
Fisher ’s least significant difference multivariate analysis variance maximum or not significant ) ratio
probability -probability plot quantile -quantile plot
randomized complete block design randomized control trials root mean square error coefficient of determination standard deviation Standard error
standard error of the mean Student Newman -K euls sum of square
中文名称方差分析置信限置信区间变异系数完全随机设计自由度一般线性模型最小有意义差异多变量方差分析最大似然估计误差均方无统计学意义优势比概率图,P -P 图分位数图,Q -Q 图完全随机区组设计随机对照试验误差均方根确定系数标准差标准误均数的标准误多组比较的q 检验平方和
入”, 在右侧找到图标, 然后将此图标拖到快捷菜单
中。
比微软数学公式编辑器更好用的是Math Type 数学公式编辑器。在网上搜索关键词“Math Type 数学公式编辑器”, 可以找到免费下载软件“Math Type5. 2数学公式编辑器”, (下载网址:http ://www. cnd8. com/down. asp ? id =4282&no=1) 。该软件为中文界面, 占用磁盘空间约为4. 4M , 其编辑界面见图1
。
图1 Math Type5. 2数学公式编辑器
(2) 微软Office Symbol 字体无论在Word 、Excel , 还是PowerPoint 中, 采用Symbol 字体, 均可将英文字母转变成希腊字母。例
41其他统计学符号的规范使用
(1) 假设检验结果的标注
标注是否有统计学意义, 通常采用“3”“、33”和“333”, 分别用来表示假设检验所得P 值小于等于
α=0. 01、α=0. 001。目前采用计检验水准α=0. 05、
算机统计软件进行数据分析, 均可以得到具体的P
值, 建议报告结果时直接给出具体P 值, 而不采用上述的标注符号。
(2) 统计学符号正斜体的书写规范统计学符号采用正体还是斜体, 具有一定的规范。例如公式、模型中代表某一变量意义的外文字母, 一律使用斜体; 代表其他意义的字母, 如自然对数e , 对数符号log 、ln , 三角函数符号cos 、sin , 极大值、极小值符号max 、min , 微分符号d , 增量符号Δ(请与三角形符号△区别) , 以及常量或者恒量等均用正体。正文及图表中外文字母的使用亦遵循此规则。
如, 如果选中表1中的最后两列(即大、小写英文字
母) , 将其字体修改为Symbol 字体后; 则倒数第二列与倒数第一列分别与该表的第二列(小写希腊字母) 与第三列(大写希腊字母) 一一对应, 完全相同。
31统计学中的常用缩写
缩写可以避免冗长的文字书写, 就像其他学科一样, 统计学也有很多常用的缩写符号(表2) 。在统计学书籍、期刊杂志中, 经常可以看到这些缩写符号, 理解其意义, 有助于阅读。另外, 在SPSS 、SAS 等标准统计学软件中, 统计分析结果也经常出现这些缩写词, 理解其意义, 有助于对其结果的理解。比如回归分析的SAS 程序运行结果中, 可以看到RMSE , 它实际意义为root mean square error (误差均方根) , 我们中文统计学教科书常称之为剩余标准差, 公式表示为: