关于月份的描述统计和方差分析

01-27

主要考虑里程数随时间变化的思路及数据分析文献综述：

首先，对数据进行描述性统计，如下表：

而从箱线图可以看到个月的里程数大致成U型。因此可以做出初步假设，1、2、12这三个月属于旺季月份。将这三个月份记作“1”，剩余的月份记作“2”，进行方差分析，结果见表2。可以看到结果是西安、厦门是不显著的，而其他城市则较为显著。则可以认为在除西安和厦门外的其他城市，这三个月的确对里程数有影响。所以在做结论时可将这三个月份单独考虑。

图1 各个月份里程数的直方图

图2 各个月里程数的箱线图

通过上表可知，对于淡旺季的分类对于大部分城市的数据还是比较显著的，即这些城市的货运量有明显的季节影响——则考虑，对淡季和旺季内的城市用同样的租车策略。

首先，对于个人和公司两种方式，可以看出租车金额都关于里程数线性增长。进行简单数学运算，找到两种方式的临界点

175L0200060L0L01740

LL0时，个人方式比较好；LL0时，公司方式比较好

下面，分别将六个城市的数据合并，对淡季和旺季的货运量作分位数的Bootstrap枢轴量的95%的置信区间，来确定淡季和旺季的里程数与1700的关系，进而对租车策略进行决策。

首先，对旺季（1月、11月、12月）进行百分位数区间估计。为了决策，我们要考虑这个时间段中1700以尽可能大的概率被覆盖。因此，对多个分位数进行置信区间的检验，过程如下：

peak=c(2260,2960,2100,2260,4256,1921,1700,2310,1800,1900,1730,2170,3170,2180,2170,4327)

dull=c(1930,1630,2830,1537,2920,1546,1930,1473,1970,1765,3124,2167,1504,1601,1503,1392,1273,1586, 1489,1423,1500,1383,1430,1640,2260,1269,2530,3220,1500,1200,1354,2154,1642,1436,1639,1482,1372,1350,1821,1332,1350,2100,

1320,1350,1930,2580,2150,2300,1380,1876,1800,1183,1280,1600)

##对数据组中的各分位数进行计算 quantile=quantile(peak,seq(0,1,0.05)) >quantile

0% 5% 10% 15% 20% 25% 30% 35% 40% 1700.00 1722.50 1765.00 1825.00 1900.00 1915.75 2010.50 2117.50 2170.00

45% 50% 55% 60% 65% 70% 75% 80% 85% 2170.00 2175.00 2200.00 2260.00 2260.00 2285.00 2472.50 2960.00 3117.50 90% 95% 100% 3713.00 4273.75 4327.00

##考虑对20%，30%，50%(中位数)进行置信区间的估计

##20%百分位数： Quan=quantile(peak,0.2) TBoot1=NULL n=10 B=1000

SD1.peak=NULL for(i in 1:B) {

Sample1=sample(peak,n,T) Tboot1=quantile(Sample1,0.2) TBoot1=c(TBoot1,Tboot1)

SD1.peak=c(SD1.peak,sd(TBoot1)) }

TBoot1[1000]

Lcl2=2*Quan-quantile(TBoot1,0.975)

Ucl2=2*Quan-quantile(TBoot1,0.025) peakPIVOTAL=c(Lcl2,Ucl2) peakPIVOTAL 得到[1572,2076]

##30%分位数

Quan=quantile(peak,0.3) TBoot1=NULL n=10 B=1000

SD1.peak=NULL for(i in 1:B) {

Sample1=sample(peak,n,T) Tboot1=quantile(Sample1,0.3) TBoot1=c(TBoot1,Tboot1)

SD1.peak=c(SD1.peak,sd(TBoot1)) }

TBoot1[1000]

Lcl2=2*Quan-quantile(TBoot1,0.975) Ucl2=2*Quan-quantile(TBoot1,0.025) peakPIVOTAL=c(Lcl2,Ucl2) peakPIVOTAL 得到[1761,2251]

##中位数

Mep=median(peak) TBoot=NULL n=10 B=1000

SD.peak=NULL for(i in 1:B) {

Sample=sample(peak,n,T) Tboot=median(Sample) TBoot=c(TBoot,Tboot)

SD.peak=c(SD.peak,sd(TBoot)) }

TBoot[1000]

Lcl1=2*Mep-quantile(TBoot,0.975) Ucl1=2*Mep-quantile(TBoot,0.025) peakPIVOTAL=c(Lcl1,Ucl1) 得到置信区间[1635.0 ,2439.5]

由上面的结果，利用bootstrap方法计算的20%~50%的百分位数的置信区间都包含了1740，并且区间大部分位于大于1740的位置。故可以认为旺季的大部分里程数是大于1740的，故在旺季的三个月，在六座城市均采用个人方式租车。

继续运用上面的方法，对淡季进行估计。

首先，对样本进行合并，考虑货运量在不同月份之间的变化有没有趋势。取数据中大于1740的为1，小于的为0，对数据做Cox-Staut趋势性检验。

【注：此处在合并数据时，将不同城市同一月份之间的数据放在一起，再将所有数据按照月份排列】

for(i in 1:length(dull)) {

if (dull[i]>1740) dull[i]=1 else

dull[i]=0 } >dull

[1] 1 0 1 0 1 0 1 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0 1 0 0 0 0 [37] 0 0 1 0 0 1 0 0 1 1 1 1 0 1 1 0 0 0

##考虑数据的出现与时间是否有关系（即从文献中获得的信息），这些数据是否是随机分布的，对变化过的数据进行随机游程检验；若拒绝原假设，再考虑与数据显示出的趋势，则需要再进行cox-staut趋势检验。

下面进行随机游程检验： > run1=as.factor(dull) >runs.test(run1)

Runs Test

data: run1

Standard Normal = -0.6446, p-value = 0.5192 alternative hypothesis: two.sided

可知，并不能拒绝原假设，并不能认为数据的出现不随机，则接下去不进行趋势检验。

既然认为数据随机出现，就说明选择哪一种租车方式其实并没有一个明确的指向性。但是，考虑到这种思路只是粗略地对数据进行了淡季、旺季两个分组，并且合并数据时，并没有仔细考虑城市之间的差异。这是因为思路和方法上的缺陷使检验结果不能使人信服。之后的方法与思路会仔细就这一点进行讨论。

为了对决策做出一个有力的支持，还是用Bootstrap方法对不同百分位数进行区间估计。结果如下： ##淡季数据的分位数：

quan=quantile(dull,seq(0,1,0.05)) >quan

0% 5% 10% 15% 20% 25% 30% 35% 40% 1183.00 1271.60 1323.601350.00 1364.80 1385.25 1429.30 1477.95 1500.00

45% 50% 55% 60% 65% 70% 75% 80% 85% 1503.85 1566.00 1605.351639.80 1780.75 1881.40 1930.00 2120.00 2171.65 90% 95% 100% 2461.00 2861.50 3220.00

依然使用上述Bootstrap方法，分别对10%，20%，30%，40%，50%，60%，70%，80%，90%的百分

由上述结果可以看到，置信区间的跨度比较大，但是我们仍然根据其中一些比较直观的结果进行大胆的推断。如中位数的置信区间并未超过1740，则就可以在源数据中找到中位数对应的月份，在其之前的月份可以认为里程数是小于1740的，则选择租用公司的方式。同样，90%所对应的也有比较大的把握，其对应的月份里程数大于1740，则选择租用个人的方式。对于其中不能判断的，则需要考虑上述所说的，忽略掉的城市之间的差异性，留待下面的方法进行讨论。

与《关于月份的描述统计和方差分析》相关的范文

04-10 高二数学下学期备课组教学计划

教学目标、教材的重点通过推理与证明的教学，进一步体会合情推理、演绎推理以及二者之间的联系与差异；体会数学证明的特点，了解数学证明的基本方法，包括直接证明的方法和间接证明的方法；感受逻辑证明在数学以及日常生活中的作用，养成言之有理、论证有据的习惯。通过计数原理的教学，使学生掌握两个基本计数原理、排列、组合、二项式定理及应用，会解决简单的计数问题；体验计数与现实生活的联系，充分体会两个基本计数原理 ...

06-23 八年级数学下册教学计划

八年级数学下册教学计划一、学生基本情况：八年级五班总人数为33人，均为男生。其中彝族学生32人，占总人数的98﹪。从上期学生期末考试的情况来看，成绩在前面的基础上还有所倒退。对大部分学生来说，简单的基础知识还不能有效的掌握，成绩较差，在几何中，由于缺少三角形全等与勾股定理的相应知识，学生在推理上的思维训练有所缺陷，学生对四边形中的相应的数量关系缺少更深入的认识。对很多孩子来说，对几何有畏难情绪 ...

02-22 2014年度下期八年级数学下册教学计划

20xx学年度下期八年级数学下册教学计划一、学生基本情况：八年级五班总人数为33人，均为男生。其中彝族学生32人，占总人数的98﹪。从上期学生期末考试的情况来看，成绩在前面的基础上还有所倒退。对大部分学生来说，简单的基础知识还不能有效的掌握，成绩较差，在几何中，由于缺少三角形全等与勾股定理的相应知识，学生在推理上的思维训练有所缺陷，学生对四边形中的相应的数量关系缺少更深入的认识。对很多孩子来说 ...

03-18 八年级数学教学计划(新人教)

　　一、指导思想通过数学课的教学，使学生切实学好从事现代化建设和进一步学习现代化科学技术所必需的数学基本知识和基本技能；努力培养学生的运算能力、逻辑思维能力，以及分析问题和解决问题的能力。二、学情分析八年级是初中学习过程中的关键时期，学生基础的好坏，直接影响到将来是否能升学。80班、81班均是刚刚接手，对班上学生不了解，从原科任老师处得知：两班比较，81班优生稍多一些，但后进面却较大，学生非 ...

04-30 高一下学期数学教学计划

一、上学期教学回顾高一共四个教学班，共计160余人。杨文国带高一（一）班，高一（二）班；张忠杰带高一(三)班和高一（四）班。其中各班期末八校联考的成绩分别为：50.6分，32.8分，27.2分，34.5分，总平36.9分。学期中途因张忠杰离开学校导致频繁更换老师，（三）班、（四）班的成绩因而受到影响。期末由王山任（三）班、(四)班的数学老师。上学期工作在学生学习的落实环节上做得不太扎实，这将是 ...

08-24 分团委书记例会内容(12月19日)

分团委书记例会内容（12月19日）一、团委年终有关工作： 1、12月21日社团风采展示秀 2、12月25日文艺晚会 3、12月29日新年文艺晚会 4、12月30日联通公司的晚会 5、元月份的团干部交流 6、寒假送温暖活动 7、年度总结各分团委在元月5日提交年度总结 8、编撰《年鉴》和《青年发展报告》。二、关于寒假社会实践围绕看家乡变化、走访劳模、参观教育基地、开展爱心援助、算算年度 ...

04-28 小学数学下册教学计划

小学数学下册教学计划一、学生情况分析：一年级现34名学生，班额较大，学生存在着很多问题。主要原因学生自主探究问题的能力弱，缺乏分析问题、解决问题及灵活运用知识的能力。有的学生缺乏良好的学习习惯、审题能力及认真听题的习惯。二、教学内容：本册教材包括下面一些内容：位置，20以内的退位减法，图形的拼组，100以内数的认识，认识人民币，100以内的加法和减法（一），认识时间，找规律，统计，数学实践 ...

10-07 六年级下册数学复习整理和复习建议

六年级下册数学复习整理和复习建议　　一、整理和复习内容　　系统的、全面的回顾与整理小学数学的全部内容。　　二、整理和复习目标　　 1．比较系统地掌握有关整数、小数、分数和百分数、负数、比和比例、方程的基础知识；能比较熟练地进行整数、小数、分数的四则运算，能进行整数、小数加、减、乘、除的估算，会使用学过的简便算法，合理、灵活地进行计算；会解学过的方程；养成检查和验算的习惯。　　 2．巩固常用计 ...

01-22 高三一模英语数据统计.试卷分析及后阶段备考策略

高三一模英语数据统计、试卷分析及后阶段备考策略试卷题型说明：20xx届xx区高三一模总分为150分，但听力部分的15分，并非高考题型，而是针对高考“听说考试”考查的部分能力自编的听力笔答的考试题型，其难度要高于高考的“听说考试”题。 20xx届区高三一模考试的目的是对新一届高三考生进行初步诊断。本试卷预测难度0.55，全区实际难度0.55。一、20xx届xx区高三一模成绩统计（表一）20xx ...

07-03 二年级数学下册教学计划

一、教学内容这册教材包括下面一些内容：解决问题、表内除法（一）、图形与变化、表内除（二）、万以内数的认识、克和千克的认识、万以内的加法和减法（一）、统计、找规律、总复习等。这册教材的计算教学内容是万以内的加、减法笔算和表内除法。这两部分内容都是进一步学习计算的重要基础。因此，表内除法同20以内的加、减法一样，是小学数学的重要基础知识，是小学生需要掌握的除法是人们在日常生活中解决问题时经常用到的数 ...

随机推荐

猜你喜欢

关于月份的描述统计和方差分析

·2014年总结及展望2014

·财务部主任岗位岗位职责

·秋学期八年级生物教学计划

·应用电子-触摸开关-毕业设计论文_-

·2015中国十大旅游投融资事件首家旅游银行成立

·2014年干部培训计划

·海报大赛策划书

·HPLC_UV测定水中微量溴酸根的方法

·人力资源招聘必须注意的6个原则

·冯小刚电影营销策略

·母爱无边:母亲节演讲稿

·2004国产轿车消费者满意度调查报告

·文章摘自[豆丁网]:导航[古今图书集成-闺媛典]

·招标采购中心年度工作总结和来年工作思路

·互联网中循证医学证据的获取

·关于嫦娥三号的作文素材:嫦娥三号携玉兔奔月

·农村土地合理流转问题文献综述

·劳动工资统计分析

·太仓市时思幼儿园集体活动备课表

·开级配沥青磨耗层0GFC的研究与分析

关于月份的描述统计和方差分析

与《关于月份的描述统计和方差分析》相关的范文

·2014年总结及展望2014

·财务部主任岗位岗位职责

·秋学期八年级生物教学计划

·应用电子-触摸开关-毕业设计论文_-

·2015中国十大旅游投融资事件 首家旅游银行成立

·2014年干部培训计划

·海报大赛策划书

·HPLC_UV测定水中微量溴酸根的方法

·人力资源招聘必须注意的6个原则

·冯小刚电影营销策略

·母爱无边:母亲节演讲稿

·2004国产轿车消费者满意度调查报告

·文章摘自[豆丁网]:导航[古今图书集成-闺媛典]

·招标采购中心年度工作总结和来年工作思路

·互联网中循证医学证据的获取

·关于嫦娥三号的作文素材:嫦娥三号携玉兔奔月

·农村土地合理流转问题文献综述

·劳动工资统计分析

·太仓市时思幼儿园集体活动备课表

·开级配沥青磨耗层0GFC的研究与分析

·2015中国十大旅游投融资事件首家旅游银行成立