应用多元统计分析课程论文
《应用多元统计分析》课程论文
论文题目: 姓名: 学院: 专业: 班级: 学号: 指导教师:
张家昕
2015年11月30日 安徽科技学院教务处
摘要
现代意义上的物流管理出现在20世纪80年代,人们发现利用跨职能的流程管理的方式去观察,分析和解决企业经营中的问题非常有效,通过分析物料从原材料运到工厂,流经生产线上每个工作站,企业可以消除很多看似高效率却实际上降低了效率的局部优化行为。物流产业的实质体现为技术密集和劳动密集相结合,是具有第三产业特征的跨地区、跨行业、跨部门特点的产业形式。物流产业对经济增长,特别是区域经济增长和区域产业协作的推动,都有着不可替代的重大意义,在区域经济、产业布局研究过程中,都不能忽视物流产业在其中的基础保障作用。本文在构建江苏省沿江地区物流产业发展综合指标体系的基础上,运用多元统计分析中的主成分分析方法,因子分析作为比较,判断本问题哪种方法更为适合,对江苏省沿江地区20个地市的物流发展现状进行了综合评价,为江苏省各地市物流产业主管部门制定相应政策提供一定的理论依据,旨在提高江苏省沿江地区整体物流发展水平。
【关键词】主成分分析;因子分析;物流产业;综合评价
一、引言
随着经济全球化持续发展、科学技术水平不断提高以及专业化分工进一步深化,经济的快速增长对物流业产生了巨大的需求,促使物流业以及与物流相关的交通运输、仓储配送和邮电通信业等都有较快的发展。同时,作为经济增长的“加速器”物流业的快速发展将会改变国民经济增长方式,降低国民经济的运行成本,促进了经济的可持续发展。物流对于经济增长的影响以及物流业与经济增长之间的关系已经成为物流领域的一个研究重点。本文拟从主成分分析的角度出发,以江苏省数据为例来探讨哪些因素是物流发展的主要因素,对江苏省物流产业发展现状进行综合评价,从而为江苏省乃至全国的物流产业的发展提供一定的启示。
二、模型的建立
2.1 主成分分析
主成分分析也称分量分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,由于多个变量之间往往存在着一定程度的相关性,因此从数学角度来看,这是一种降维处理技术。以各个主成分为分量就得到一个更低维的随机向量。因此通过主成分分析既可以降低维数又保留了原数据的大部分信息。假定
有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的数据矩阵
x11x12....x1px21x22....x2px
................ (1) xx....x
npn1n2
可是如此多的变量,我们如何从这么多变量的数据中抓住主要的变量作为指标呢?
要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好
如果记原来的变量指标为x1,x2,„,xp,它们的综合指标——新变量指标为z1,z1,„,zm(m≤p)。则
z1l11x1l12x2...l1pxp
z2l21x1l22x2...l2pxp
...................................................lmpxpzmlm1x1lm2x2
在(2)式中,系数lij由下列原则来决定:
(1)zi与zj(i≠j;i,j=1,2,„,m相互无关);
(2)
不相关的x1,x2,„,xp的所有线性组合中方差最大者;„„;zm是与z1,
(2)量。z1是x1,x2,„,xp的一切线性组合中方差最大者;z2是与z1
z
2
,„„zm1都不相关的x1,x2,„,xp的所有线性组合中方差最大者。
这样决定的新变量指标z1,z2,„,zm分别称为原变量指标x1,x2,„,
x的第一,第二,„,第m主成分。其中,z在总方差中占的比例最大,z,z,„,z的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成
p
1
2
3
m
分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。
从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,„,p)在诸主成分zi(i=1,2,„,m)上的载荷lij(i=1,2,„,m;j=1,2,„,
p),从数学上容易知道,它们分别是x1,x2,„,xp的相关矩阵的m个较大
的特征值所对应的特征向量。
主成分分析是社会经济问题中研究应用最多的多元统计方法之一,其原理是利用降维的思想,在保证原始数据信息损失最小的前提下,将原来指标重新组合成一组新的互相无关的几个综合指标,这几个综合指标是原始指标的线性组合。并且保留了原始指标的主要信息,彼此间又互不相关,使复杂的问题简单化,抓住主要矛盾进行分析。
基本步骤为:确定分析变量,收集数据;原始数据的标准化处理;由标准数据求协方差矩阵;求R的特征值、特征向量和主成分的方差贡献率;提取主成分;求主成分分值,计算综合分值。
2.1.1数据选取以及指标来源
根据上文主成分分析的基本原理,本文以江苏省为例,考虑到统计数据可获得性,本文选取“地区生产总值”作为物流需求规模影响指标;选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;选取“第一、第二、第三产业的产值”作为产业结构的影响因素。具体选择的指标为:
x:地区生产总值,单位:亿元;
1
x:第一产业产值,单位:亿元;
2
x:第二产业产值单位:亿元;
3
x:第三产业产值单位:亿元;
4
x:公路里程,单位:公里;
5
x:以及车辆拥有量,单位:万辆;
6
其中,三大产业不仅考虑了区域经济总量,还考虑了江苏省经济结构对物流需求规模影响。(具体的原始数据见表1所示)
表1 2013年江苏省各地区6项主要指标
数据来源:江苏省统计年鉴2013 2.1.2先用因子分析对数据处理
我们要考虑的是:如何根据这些经济指标,对各个地区进行综合评价与排序?
因子分析也是一种降维,简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观察数据中的基本结构,在研究江苏省沿江地区物流发展示所涉及的指标很多,过多的指标容易导致分析过程复杂化。一个合适的做法就是从这些关系错综复杂的经济指标中提取少数几个主要因子,每个主要因子都能反映相互依赖的社会经济指标见共同作用,因此选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;选取“第一、第二、第三产业的产值”作为产业结构的影响因素,抓住这些主要因素就可以帮我们对复杂的物流发展问题进行深入分析,合理解释和正确评价。
2.1.3因子载荷aij的统计 对于因子模型:
xafaf
i
i1
1
i2
2
...aij
f
j
...aim
f
m
i , i1,2,...p
我们可以得到xi与
f
i
的协方差为
cov(xi,
f
m
)covaiki
k1
f,f
k
i
m
covaikjk1
f,f
k
covi,j
f
j
a
ij
设因子载荷矩阵为A,称第j列元素的平方和,即
2j
p
g
为公因子
aij , j1,2,...m
i1
2
f
即g表示同一公共因子j对x的贡献,
j
2
f
j
对各变量所提供的方
差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。
三、模型求解
3.1以因子分析的结果进行主成分分析 (一)主要运算结果分析
变量共同反映每个变量对所提取的所有公共因子的依赖程度,此数值是因子载荷阵中每行的因子载荷的平方和,提取的因子个数不同,变量共同程度也不同。从标准化数据出发,我们先计算这些指标的主成分,然后通过主成分的大小进行排序,对原始数据进行标准化处理。计算特征值、方差贡献率以及各指标的相关系数矩阵。利用SAS9.1.3软件对标准处理的数据进行处理。特征值、方差贡献率的结果如表2所示,各指标的相关系数矩阵的特征值如表3所示,各地区的综合得分如表4所示,
表2 方差分析表
提取方法:主成分法
提取主成分。如表2所示,利用因子分析的结果进行主成分分析,提取前2个特征值的主成分,这两个主成分的累计方差贡献率达到98.26%,表明提取的前2个主成分可以基本反映全部6个指标所具有的信息,能在一定程度上说明区域物流产业发展的综合因素,从特征向量我们可以写出6个主成分的具体形式如下:
Prin1=0.419061x1+0.381547x2+0.399822x3+0.423129x4+0.400101x5+0.424067x6
Prin2=-0.312072x1+0.631509x2-0.489653x3-0.176339x4+0.477188x5 .-0.072414x6.
.
利用SAS9.1.3统计软件进行数据的处理,得出相关系数矩阵的特征值(见表3),进而得到主成分的表达式可以表述为:
表3各指标相关系数矩阵的特征量
我们以特征根为权,对6
个主成分进行加权综合,对原始数据进行标准化处理计算出各地区的综合得分(见表4),负分值不表示物流产业发展的能力差,评价分值只是反映了物流产业发展能力的相对强弱。综合得分的计算公式是:
Y
YY...Y
表4综合排序
1
2
6
6
1
6
2
6
i1
i
i1
i
i1
i
6
从表4的综合排名可以看出,南京市的综合评价排在第一,原始数据也反映出南京市存在明显的发展优势,另外得分为正值的地区只有5个,得分为负值的市有15个,这信息说明江苏省的物流产业发展目前并不容乐观,并且地区之间的发展不平衡,易形成两极分化的局势。
四、模型的分析与应对措施
针对本文影响物流产业发展能力的主要因素的分析,提高地区物流产业发展能力具体政策建议如下:
(一)加快产业结构的转换,构建合理的产业结构
从上述结果看第一产业产值与江苏省物流产业的发展呈现了高度的相关性,而并非第三产业,说明当第一、二、和第三产业构成比例不合理时,对物流需求就出现了削弱作用。因此,在发展江苏省物流产业时必须先加快产业结构的转换,构建合理的产业结构。
(二)加快物流产业基础设施建设,完善物流发展平台
基础设施优越的区域,运输条件便利,就可以吸引更多的物流,这与本文最终分析的结果是一致的。因此,在江苏省物流产业发展的过程之中,必须不断完善基础设施建设,加大铁路、公路以及内河的里程。加大投资,增加车辆的拥有量。构建合理的物流信息平台,加大物流人才的培养等。 (三)加强政府对物流业发展的规划,制定人才开发战略
各级政府要加强对物流业发展的规划和指导,加强宣传引导,营造物流业发展的良好环境,制定物流人才开发战略,建立吸引人才的有效机制。 在贯彻落实好国家和省现有推动物流业发展有关政策的基础上,进一步研究制定促进物流业发展的土地、税收、融资和交通管理等方面的政策措施。省及地方各级人民政府在财政资金安排上,支持重点物流项目建设、物流人才培养、物流科技研发和物流基础性工作。在符合国家、省用地政策的前提下,优先安排省级重点物流项
目用地。对全省重点物流企业的土地和房屋使用税实行适当减免,用足用好物流营业税抵扣政策。制定城市物流配送车辆通行便利措施和降低物流企业规费负担的政策。
(四)加快经济发展,提高最终消费支出
实践证明,经济越发达地区对物流的需求规模越大,经济增长对物流需求有很大促进作用,这点从模型结果也得到验证。因此,要想加快江苏省物流产业的发展必须加快经济的发展,并且要制定相应的刺激消费的政策,提高最终消费支出。
(五)在国家以及各地的“十五”规划中,统筹考虑新型物流基础设施的发展要求,避免重复建设和资源的浪费
【参考文献】
1.林璐龙;海峡两岸经济区产业布局与物流产业发展研究[D];厦门大学;2007年 2.孔令刚;物流产业对区域经济发展的作用研究——以合肥为例[A];中部崛起与现代服务业——第二届中部商业经济论坛论文集[C];2008年
3.邵扬;物流业对中国经济增长的影响研究[D];吉林大学;2009年
4. 平先秉;基于主成分分析的湖南物流产业发展综合评价[A];湘潭职业技术学院经贸与管理系;2009年
5.于宏.用主成分分析和聚类分析方法进行水文分区[J].
6.罗盛,张锦,陈景武.关于结合应用因子分析和多元逐步回归完善趋势面分析的探讨[J].数理医药学杂志,2010,23(5):613~614
7.何晓群编著.《多元统计分析》.中国人民大学出版社,2004.
8.闫新华,王华.《我国城镇居民消费水平的实证研究》[J].统计与信息论坛,2003. 9.卢纹岱,《SPSS for Windows 统计分析》[M].北京:电子工业出版社,2000. 10.宇传华,《SPSS 与统计分析》.电子工业出版社,2007.
11.张智越.基于主成分分析的区域外贸竞争力综合评价研究[J].价格月刊,2010(401):83~86 12.龚勇,周迎迎.基于因子分析的浙江省区域金融中心选址研究[J].经济丛刊,2009(5):19~21