硕士论文质量评价问题
赛题类型代码:B
硕士论文质量评价问题
我国自1980年建立新的学位制度以来,已初步形成了具有我国特色的研究生招生和培养模式,并且随着社会环境的变化和人才培养的不同要求适时作出调适。如:入学类型开始有了在职人员和非在职人员、定向培养和非定向培养、直博和提前攻博等类型;招生工作中的计划内定向培养意识逐渐淡化,出现了在职攻读学位等进校不离岗的招生形式等等。然而,这种多样化的招生和培养方式,也使得研究生论文质量问题日益引起人们关注。特别是近年来研究生招生规模的迅速扩张,以及研究生在国家发展与社会进步中发挥的越来越大作用,更使研究生论文质量问题成为人们关注的焦点。如何建立合理的研究生论文质量评价体系,并通过量化的手段找出当前国家在研究生招生过程中存在的问题,进而调整招生政策,改革招生方式,真正吸收综合素质高和研究能力强的优秀学生进入研究生队伍,已成为保证、提高硕士研究生论文质量的第一大关口,是国家乃至个人都十分关注的一项课题。
为全面贯彻科学发展观,落实以质量为核心的发展要求,全面分析和评价我国硕士生质量,制定进一步提高硕士研究生教育质量的政策,需要对硕士生的招生质量、论文质量、培养质量等进行综合评价。
某校正开展硕士生质量评价,现搜集到2006、2007、2008年硕士生论文的评阅信息,分别按年存放在相关数据库中。附件1和附件2中给出2006,2007,2008年各年硕士论文的评阅信息。全部存放在Excel表中。
请根据这些信息分析解决以下问题。
1. 对2006,2007,2008年各年硕士生论文选题与开题进行总体评价。包括各专业的评价和各年的总体评价。
2. 对2006,2007,2008年各年硕士论文评分的评价。包括各专业与各年的总体评价。
3. 对各专业、各年硕士论文选题开题与论文得分之间的相关性进行分析,你从中得出什么结论?
4. 对2006,2007,2008年复审(毕业后的重新评阅)论文的评价。包括各专业与各年的总体评价。
5. 对硕士毕业前后论文的评分结果进行分析,你得出什么样的评论。说明你的观点与结论。对此你有什么建议。
附件1 2006_2007_2008年硕士生论文抽查表(Excel表)
数据说明
XT代表表1中开题的评价结果.
KT1, KT 2,„, KT 6分别代表表2中6项开题的评价结果. A1, A2,„,A7 别代表表3中第一位专家的盲审评阅结果. B1, B2,„.,B7分别代表表3中第二位专家的盲审评阅结果. 每篇抽查的硕士论文都被两位专家评审,并有7项打分.
附件2 2006_2007_2008年硕士论文复审抽查表(Excel表)
A1,A2,„,A7-分别代表表3中专家的盲审评阅结果,复审时每篇论文只有一位专家评审. 送审编号:前两位代表毕业的年,3~4位代表所属学科的序号,5~6位代表该年该学科的送审论文序号。如080101表示2008年的论文,所属学科是1,在在学科中论文序号为1。
附件中数据说明:
表2 硕士论文开题报告指标
西安邮电学院第六届 大学生数学建模竞赛
参赛作品
参赛队编号: 431 赛题类型代码: B
关于硕士论文质量的评估
摘 要:本文解决的是硕士论文质量的评估问题,基于对该校招生规模、录取类别和学科类型的了解,结合2006-2008年硕士论文抽查表和硕士论文复查评分表,经过详细的分类汇总,分别统计出了2006年-2008年硕士生论文选题与开题和各专业之间的数据、各学科各年份人数数据表、录取类别与各指标间均值关系数据表(烦请见纸质版附录一)、各学科复审表、各学科复审数据详表(【注】烦请见电子版附录三)、选题开题与各学科关系数据详表(【注】烦请见电子版附录三)等系列表格,运用matlab、excel绘制出图形,分析选题、开题与学科及选题开题与年份之间的关系,对问题三建立典型相关性模型,对2006年至2008年及硕士毕业后的论文进行分析和评价,对于前四个问题均使用图解法解答问题,使繁杂微妙的数据变化清晰地变现出来。问题一:通过问题的阐述,分别对学科和硕士论文选题和开题、各年对硕士论文选题和开题进行分析,分别在所给的2006到2008的数据中统计出学科类别和专家评论值的关系表格,运用matlab软件绘出图形,分析出各专业与各年的对硕士论文质量的比重;问题二:思路继续沿用问题一,统计出数据,运用excel绘制出图形,分析出硕士论文评分和各专业、各年之间的线性关系;问题三:首先通过所给数据统计出论文得分和论文选题、开题的均值、方差,及其两者之间的协方差、求出其相关系数,应用excel绘制关于相关系数的图形,分析出论文选题、开题和论文得分之间的相关程度;问题四:通过在excel中绘制图形对数据进行分析,得出其典型相关系数,通过对图标的分析,得出其两者之间的相关程度;问题五:综合前面几个问题,对分析出的结果进行评估,我们发现一些规律和现象。
关键字:excel、统计、数据表、典型相关性模型、图解法
硕士论文质量评价模型
一、问题重述
硕士论文是硕士研究生所撰写的学术论文,优秀的学术论文能够很好地反映出作者对所学专业的理论知识的掌握程度和水平与科研能力,帮助作者构建起良好的完整的知识体系,同时论文自身具有一定的深度和较好的科学价值,对本专业学术水平的提高起到积极的作用。在我国,自1980年建立新的学位制度以来,初步形成了我国特色的研究生招生和培养模式,并且还在不断随着社会需求适当作出调整,出现了定向培养与非定向培养、直博与提前攻博、在职攻读学位等形形色色的招生形式,然而这些多样化的招生和培养方式使得研究生的论文质量问题受到越来越多的人们的关注,如何建立合理地硕士论文质量评价体系并通过量化的手段找到当前国家在研究生招生过程中存在的问题,继而调整招生政策,吸收综合素质高和科研能力强的学生已成为保证和提高硕士研究生论文质量的重要一环。
本次的数学建模竞赛通过为我们学生提供某校2006年、2007年、2008年硕士生论文的评阅信息,让我们对硕士生的招生质量、论文质量、培养质量等进行综合评价,提出自己对于提高硕士研究生教育质量的政策。我们根据这些信息需要解决以下5个问题:
1.对2006年、2007年、2008年年各年硕士生论文选题与开题进行总体评价,包括各专业的评价和各年的总体评;
2.对2006年、2007年、2008年各年硕士论文评分的评价,包括各专业与各年的总体评价;
3.对各专业、各年硕士论文选题开题与论文得分之间的相关性进行分析,并谈论自己从中得出的结论;
4.对2006年、2007年、2008年复审(毕业后的重新评阅)论文的评价,包括对各专业与各年的总体评价;
5.根据所给数据进行不同的分类、整合,再依靠所整合的数据画出图形、建立模型,最后对图形进行分析,从而对硕士毕业前后论文的评分结果得出我们自己的观点与结论。
二、模型假设与符号说明
2.1 模型假设
1. 假设自2006年起论文题目与各学科紧密性一致; 2. 学生写作论文的能力符合正态分布; 3. 2006年到2008年两位专家没有更换 2.2 符号说明
Cov(X,T):随机变量X与T的协方差; D(X) :随机变量X的方差; D(T) :随机变量T的方差;
ρ:随机变量X与T的相关系数; E(X):随机变量X的均值; E(T):随机变量T的均值.
三、问题分析
3.1对问题(1)和(2)的分析
问题要求总体评价2006年至2008年的硕士论文选题与开题质量,我们用excel分别绘制出各专业与硕士论文选题、开题之间及各年与硕士论文选题、开题之间的图形,在图形上我们分别分析两组之间评价的变化。 3.2对问题(3)的分析
对论文选题、开题与论文得分两组之间的相关性进行分析,从而我们建立典型相关性模型,分别求出每组的均值、方差、及其两组之间的协方差,从而计算出它们之间的相关系数,在excel中绘制出相关系数的图形,分析相关系数的变化,得出它们两组之间的相关程度。 3.3对问题(4)的分析
问题(4)是对硕士毕业后的论文进行复审,我们分别统计出各专业和各年分别与论文评价之间的数据关系,在excel中绘制出图形,寻找、分析他们评价的变化规律,从而得出其总体评价。
四、模型建立与求解
4.1模型准备
我们分别通过分析专业和论文选题、开题之间的关系,年份与论文选题、开题之间的关系,用之前统计出的数据在excel中绘制出图形,建立出图解模型,第二题和第四题分别通过硕士论文评分与各专业及个年份之间的数据,复审论文和各专业及年份之间的数据,通过这些数据在excel中建立图解模型。 4.2问题(1)、(2)、(4)的模型建立与求解 4.2.1:分析解决问题(1)
我们从所给出的附件数据中分别应用excel统计函数,统计出选题、开题和各年、各专业的之间的数据关系及其图形,如下图所示:
下表为年份与论文选题、开题之间的数据:
下图为选题、开题与学科类型的关系图:
由上图可以分析出对于学科与选题、开题之间的评价关系,其分析结果为:对XT的分析:硕士论文的选题的评价对每个专业基本介于有使用价值和理论意义、有使用价值之间;对KT的分析:通过对论文难度的分析可以得出论文的难度基本介于偏高和适当之间、研究方案可行性介于可行与基本可行之间、研究生对文献资料和课题的了解程度还是比较深的、研究生对论文选题报告中反映出的综合表达能力还是不错的,专家对论文选题报告的总体评价都比较高。
从整体来看:每个学科的总体论文水平都比较高,说明每个学科的学生写作论文的水平都相差不多,从其上下波动可以看出,学生写作论文的水平服从正态分布。
下图为选题、开题与年份见的关系图:
由上图可以分析出年份与选题、开题之间的评价关系,其分析结果为:对XT的分析:2006年到2008年硕士论文的选题很合理,基本都是有意义有使用价值的选题;对KT的分析:只有在2006年硕士生对文献资料和课题了解程度较2007年、2008年比较低,其他指标评价都比较高。
从整体来看:从2006年到2008年,所示论文质量有一定的提高,其与国家在教育方面的投资和政策有很大关系,说明国家对教育进一步加大改革,以培养出素质更高的研究生。
4.2.2:分析解决问题(2)
我们从所给的2006年-2008年的数据表格中,提取出来两位专家的评分(A1,A2,..A7;B1,B2,..B7)分别与专业和年份的数据,通过数据统计,应用matlab、excel绘图表格,绘制出两幅折线图,分别是:论文评分与年份之间的关系、论文评分与学科类型之间的关系。其用excel数据表格和绘制出的关系图如下:
下表为年份与专家评分之间的数据表格:
由上表所列三年间两位专家评分的平均值可以分析出年份与专家评分间的关系,其分析结果为:两位评审专家对从2006年到2008年三年时间内论文选题(A1/B2)、文献综述(A2/B2)、论文难度与工作量(A3/B3)、发表学术论文及获奖(A4/B4)、论文体现的理论基础和专门知识(A5/B5)、论文体现作者的科研能力(A6/B6)、学风写作能力(A7/B7)盲审评阅结果基本保持不变
【注】专业与专家评分之间的数据表烦请见电子版附录三
下图为论文评分与年份之间的关系图:
论文评分与年份之间的关系图
由上图可以分析出专家的评分与年份之间的关系,其分析结果为:从2006年到2008年,两位专家的评分基本波动不大,说明专家的评判没有很大失误,但随着年份的增加,专家的评分值稍有增加,因此此图说明了硕士论文的质量是随着年份提高的。
下图为2006年到2008年论文评分与学科类型的关系图:
从上图可以分析出论文评分和学科类型的关系,其分析结果为:①在学科3,5,23处专家评分有些下降,原因是:在2006年和2007,没有开设这些专业;②每个专业的评分基本都没有很大的波动,说明每个专业的硕士论文写作水平没有较大变
化,说明该学校学生的整体素质都比较好,而且在国家对硕士的扩招上硕士的素质并没有因此下降。
4.2.3:分析解决问题(4)
在附件中对复审的表格数据进行统计,分别统计出专家复审论文评分和专业之间、专家复审论文评分和年份之间的数据,在excel中绘制出两组之间的的关系图,分析变化波动,得出分析结果。其数据表和折线图如下:
下表为专家复审论文评分与专业之间关系的折线图:
由上图可以分析出为专家复审的和专业之间的评价,其分析结果为:①在图中7点处所有出具全为0,因为在复审中没有开设专业7;②在图中可以看出论文难度(A1)、发表学术论文及获奖(A4)的波动较大,说明硕士毕业后其论文难度有提高的也有降低的,分析其原因为:毕业之后有研究型硕士,其论文难度会增加,有非研究型硕士他们写论文的机会会减少,所以其论文的难度会降低,对研究型硕士他们发表的论文和获奖可能会增加,而非研究行则会降低,其他数据值表则五多大变化,说明该校学生的整体素质在毕业后没有多大下降。
下表、下图分别为年份与专家复审评分之间的数据表格与关系图:
系列1表示2006年,系列2表示2007年,系列3表示2008年
由上图可以分析出论文复审与年份的关系,其分析结果为:随着年份的增加,专家评分的分值有细微的增加,可以反映出来论文质量较年份的增加有所提高,说明硕士的素质有所提高,国家的教育政策恰当。
【注】专业与专家复审评分之间的数据表格烦请见电子版附录三
4.3问题(3)的模型建立与求解
模型的建立:
问题三要求分析各专业、各年硕士论文与选题开题与论文的分之间的相关性,我们建立典型相关性模型,把各专业、各年硕士论文选题开题的数据根据录取类型分为六组,将X(X1,X2,X3,X4,X5,X6)和论文得分的数据A(A1,A2,A3,A4,A5,A6)看作两组变量,分别求出D(X)D(T)和Cov(X,T)。计算出六组中对应的相关系数ρ。
模型的求解:相关系数的求解过程:
应用excel中的Varp函数求出方差、Covar函数求出协方差:求出的结果如下表格所示:
在求解相关系数ρ时应用公式:
求解出来的相关系数为下表中数据:
根据上表中的数据在excel中绘制出其图形,图形如下:
由图可以看出:在2007年和2008年没有同等和在职的硕士录取类型,且其余的相关系数均为负值,相关系数的绝对值均小于0.18,说明其两者(X,T)之间的线性关系还是很密切的,说明硕士论文的选题和开题对其论文的得分影响很大,结合实际,可以很容易明白,选题的不当肯定会影响其论文得分,因为在2007年和2008年没有同等和在职两种招生类型,分析原因为:国家为了更好的培养出高素质人才,将招生类型进行优化,故取消这两种招生方式。
4.4问题(5)的分析结果:
综合上述所解决的问题,分析结果如下:对于不同专业、不同年份的硕士来说,其毕业前后的论文选题和其专业的相关性很合理,对其专业的了解程度及文献的引用都很好,但是不同的是在硕士毕业后其论文的难度和发表学术论文及获奖没有毕业前稳定,毕业后其难度出现难度加强和难度降低,分析其原因为:毕业后做研究性工作的硕士论文难度加强,由于其研究的学科深度加深,非研究性硕士其论文质量有一定的下降,但下降的不是很厉害,这个得益于国家对全国普通高校的硕士培养方法。在前面的数据分析到了学科的类型在2008年增加,说明高校在扩招,但分析结果表明扩招对硕士的素质没有多大的影响。对此,近几年在教育方面国家的政策合理、培养方式合理,希望每个学校紧跟国家政策,制定自己学校的学生培养方案。
五、模型评价
5.1模型优缺点 5.1.1模型优点 (1) 在问题(1)、(2)、(4)中建立的模型是图解模型,折线变化趋势一目了然,结果分析很方便。
(2) 在问题(3)中,应用典型相关分析法,对模型进行求解,求的出的相关系数ρ可以很直观的了解其两者之间的相关程度,且其求法我们在概率中已经学到。 5.1.2模型缺点
(1) 问题(1)、(2)、(4)中应用的图解模型在绘图中数据的处理难免有误差,其不能准确无误的反映各组变量之间的关系。
(2) 在建立(3)中模型时,我们处理每两组变量中的六个变量是,难免会有失误之处,我们不考虑每位专家对其评分标准的改变,所以求出的相关系数是一组理想数值。
5.2 模型改进
在模型建立中我们只关心到数值的波动范围,并没有细分下去,详细彻底的分析每个异常的数值是什么原因产生的,其对硕士的论文有什么影响,这点是我们分析过程中要改进的地方,我们分析的结果只是大致的说明了一下硕士论文质量的影响是由什么原因构成的,并没有详细的分析其论文质量的影响原因,今后在类似的问题中我们要加以改进。
参考文献
[1] 丁正生.概率论与数理统计简明教程.高等教育出版社. 2005.
[2]百度文库.试卷综合评价分析的数学模型.http://wenku.baidu.com/view/c5951e3e0912a216147929f4.html .(2011年5月1日). [3]百度文库.如何快速通过研究生学位论文的查重问题..(2011年5月2日).
[4] 百度百科.硕士论文..(2011年5月2日)
附录
附录一:2006年-2008年录取类别与各指标间均值关系数据表.docx 附录二:
论文中第二题运用matlab对专家评分和年份的关系进行了图形绘制,其matlab程序如下:
x=[8.67,8.52,25.47,17.27,8.56,8.45,8.56,8.62,8.42,25.52,17.27,8.56,8.53,8.62]; >> y=[8.70,8.55,25.56,17.36,8.58,8.55,8.66,8.72,8.51,25.75,17.34,8.57,8.58,8.64]; >> z=[8.75,8.52,25.77,17.42,8.62,8.53,8.65,8.73,8.54,25.73,17.34,8.58,8.52,8.60]; >> t=0:2:26;
>> plot(t,x,t,y,t,z)
附录三:()
1.
2.
3.
4.2006年-2008年各学科复审数据统计表.xlsx
5.2006年-2008年各学科盲审数据统计表.xlsx
6.2006年-2008年选题开题与各学科数据统计表.xlsx
【注】超级链接的使用方法:摁住Ctrl并单击可访问链接