社会调查研究方法教案第8章文献研究
第8章 文献研究(4学时)
第一节 文献与文献研究
一、文献的类型
所谓文献,其原义主要指包含各种信息的书而材料或文字材料。随着社会的发展,信息传播的载体也越来越多样化。因而,我们可以将文献定义为包含我们希望加以研究的现象的任何信息形式。根据文献具体形式和来源的不同,我们既可以将其分为个人文献、官方文献及大众传播媒介三大类,也可以把它分为原始文献(也称为初级文献或第一手文献)和二次文献(也称次级文献或第二手文献)两大类。还可以划分成现时性的文献和回顾性的文献,或者文字文献、画面文献、声音文献等等。文献分类说明见表8—1。
表8-1 按两个标准划分的文献类型
以下我们对社会研究中几种常用的文献类型略作说明。
1.日记、回忆录和自传
这三者都是当事人亲自所写的第一手文献。人们记日记的原因多种多样。但对于大多数普通人来说,记日记主要是把每天所发生的有意义的事记录下来,将来回亿过去的时光时往事又会历历在目。日记属于个人隐私的范围,不经主人允许,其他人不能随意翻阅,所以,这也给利用日记进行研究带来很大困难,日记这一文献资科的利用所受的局限很大。
回忆录和自传既有相似的地方,又有一定的区别。回亿录往往是作者对于自己在某一时期中的一些特殊经历的描述。在这一描述中,作者本人心以不是中心的人物;自传是对作者从小到大,直至目前的生活历史,按时间顺序给出的连续性记述,传主是记述中惟一的中心人物。回忆录对于研究过去发生的某一事件或运动以及社会变迁来说,有较高的价值。 而利用自传来进行社会学研究的最杰出的例子也许就是美国社会学家托马斯和兹纳涅斯基所作的波兰农民的研究了。当然,这种做法的科学性也受到人们的质疑。有的人提出,
即使是在当今社会中,究竟有多少受过教育的27岁的青年能写出长达三百多页的生活历史?
2.信件
信件也常常作为一种描述事件或者描述人们对某种事物的个人感情的资料。利用信件来进行社会研究的做法,同样受到不少人的指责,对于特定的社会学目的来说,现在几乎没有什么类型的通信可以很容易地被利用,也没有什么类型的通信对社会研究有价值。他们指出,即使信件对研究是可用的,也存在很大的局限性。首先,写信的人通常并不能构成普通人口总体的代表。另外,人们在信件中对于事件的描述往往是经过不正常的压缩的,并且往往是从特定角度来描述的。
3.报刊
这是文献研究中用得较多的资料来源之一。从报刊的版面、封面、标题,直到刊登的文章、消息、报告等等,都可以是人们进行社会研究尤其是采用内容分析方法进行研究时所用的材料。报纸中的新闻报道常常成为人们分析某一事件或运动的依据。但是,有一点应该注意:报纸上的报道文章通常并不是事物的全部
4.官方统计资料
这是文献研究中另一个重要的资料来源。无论是全国人口普查资料,还是出国家统计部门、各级政府部门、各级专业机构编制的月统计报表、年统计图表、年统计报告等等,都是社会学者研究社会的极有价值的资料。
5.历史文献
在某种意义上,要从文献中划出“历史”的文献这一部分是不可能的,因为所有的文献资料实际上都是历史的,即都是关于过去的。但是,在实际研究中,人们还是根据若干特征将这一类文献与其他文献区分开来。一般来说,历史文献往往是指那些在形成的时间上距目前较远并且文献的作者以及所记述的事件和运动的当事人都已去世的资料。
二、文献研究及其类型
文献研究是一种通过收集和分析现存的、以文字、数字、符号、画面等信息形式出现的文献资料,来探讨和分析各种社会行为、社会关系及其他社会现象的研究方式。
根据研究的具体方法和所用文献类型的不同,可以将文献研究划分为若干不同的类型。其中社会研究者最常用的有内容分析、二次分析和现存统计资料分析。
—、内容分析的概念
1.内容分析的定义
内容分析是20世纪才开始兴起的一种新的文献研究方法。它通过考察人们所写的文章、书籍、日记、信件、所拍的电影、电视及照片、所创作的歌曲、图画等等,来了解人们的行为、态度和特征,进而了解和说明社会结构及文化变迁。内容分析方法假定:在这些传播的材料中所发现的行为模式、价值观念和态度,反映出并影响着创造和接受这些材料的人们的行为、态度和价值观。因此,除了信息本身的内容外,内容分析还被用来研究信息发出者的
动机,以及信息传播的效果或影响。我们可以用图8—1来表示这种关系。
信息内容
图8-1
2.内容分析的类型
内容分析可以按大的方法论取向分为定量的和定性的两种,然而,需要注意的是,大部分著作中往往只将定量取向的一种称为内容分析。从一些主要的社会研究方法著作关于内容分析法的定义中,我们可以十分清楚地看到这一点。
内容分析对各种信息传播形式的明显内容进行客观的、系统的和定量的描述。研究者所分析的只是这些外在的、表面的内容,而不是内容的深层解释。“进行客观的、系统的”描述,意味着内容分析是——种规范的方法。它要求研究者根据预先决定的计划,采取一定的规则,按照一定的步骤来进行。而“定量的”描述则说明内容分析方法的基本性质。它意味着,在内容分析中、其主要目标通常是决定内容中某一项目的频数,或者决定某一类别在整个内容中所占的比例等等。
实际上,实证主义和人文主义两种方法论不仅在社会学研究方法中有定量研究方式(如调查研究)和定性研究方式(如实地研究)与之一一对应,在内容分析方法中,也有定量的内容分析和定性的内容分析一一对应。只不过就像定量研究成为衬会学经验研究的主流一样,定量的内容分析也一直是内容分析的主流。
定性的内容分析主要由研究者通过问读、收听或观看,然后依靠文观的感受、理解、体会和分析,来解读、判断和挖掘信息中所蕴涵的本质内容。这种分析方法与文学中的“文艺批评”、“文学评论”等所采用的方法相似。“阅读——感受——分析——理解”就是这种内容分析的一般模式。十分明显的是,研究者的主观分析在这种方式中占据着绝对重要的地位。我们将主要对定量的内容分析方法进行介绍。
3. 内容分析的例子
理解内容分析方法之实质的一种好的途径就是通过一些具体的实例来学习。我们来看看2个内容分析的实例。
例1 全家合影相片中所反映的家庭关系。
在一项有关不同代际家庭关系的研究中,社会学家费希尔对30户美国家庭在1729年到1871年之间的全家合影照片的内容进行了分析,他发现,1775年以前,所有的照片中除了一张外,全都是父亲位于家庭其他成员之上(即在后排站着),母亲则坐着,旁边可能还坐着家庭中其他的成年女性,子女则在母亲之下。1775年后,这种暗示着父亲的家长角色和父
母高于子女的等级角色的垂直安排,被一种水平安排所取代;在这种水平安排中,所有的家庭成员都处于同一层次。把这些早期的全家合影同更接近于当代的全家合影相比较,费希尔发现,暗示着家庭中成员之间的相互平等的水平安排,又被20世纪中这种安排的更大变化所取代,比如在某些合影中,子女的位置处于父母之上。
例2 期刊内容与社会问题。
60年代对美国来说是一个骚乱的年代。方克豪瑟通过对期刊的内容分析,来研究这一时期美国社会所面临的重大问题。他从美国1960年至1970年的期刊中.选出三种最著名的周刊,把这三种期刊在10年中出版的全部刊物作为他分析的样本。刊物总数为l716份。然后,他按照《读者指南》的编目,把每一类条目下的文章篇数记下来。表8-2是他的统计结果与盖洛普民意调查结果的对照。
表8—2 新闻杂志对60年代各类问题的报道及盖洛普调查关于各类问题重要性的排列顺序
注:新闻报道的排列顺序与盖洛普调查关于各类问题重要性的排列顺序的相关系数为0.78(P=0.001)
*这些项目在盖洛普调查中未列入“重大问题”故记为相同的顺序数。
从表8—2我们不难看出二者的结果十分相近,它表明这两种不同的研究方式所得到的结果具有较大的一致性。
二、内容分析的程序
与其他研究方法,特别是与调查研究的方法相似,内容分析方法在研究过程中也要作出若干非常具体的选择和决定。
1.抽样
在对某种文献进行内容分析时,首先遇到的问题就是抽取样本。像以人为对象的研究一样,以文献为对象的研究中也常常不可能直接研究全部对象。因此需要通过抽取有代表性的样本的方法,来达到研究全部对象的目的。内容分析的抽样常常从杂志、报纸、电视节目、广告或其他类似文献的标题或期号中进行。还有一些则是在作者、书籍、章节、段落、句子、短语、词汇等层次上进行的。我们在抽样中介绍的各种抽样方法,都可以在内容分析中运用,特别是分层随机抽样、多阶段随机抽样的方法运用得更为普遍。
内容分析中的抽样通常分为三个主要的阶段,它涉及到三个不同性质的总体。在每一总体中所采用的抽样方式也常常是不同的。首先是名称的抽样。在进行名称抽样时,经常采用分层抽样的方法。而常用的分层标准有:(1)地域分布:(2)受众类型:(3)编辑方向:(4)重要性或规模;(5)播发时间。当然,有时名称的抽样采用的是目的抽样,而非随机抽样。其次是期号的抽样,即从期刊或报纸的所有期号中抽取若干期号,或从电视台所有时段中抽取不同的时段,或是从所有栏目中抽取不同的栏目等。最后是内容的抽样,即从所抽中的期号、时段或栏目中抽取所分析的内容。
2.编码
内容分析的基本做法是对样本中的信息进行编码,即根据特定的概念框架,对信息——无论是口头的、文字的、画面的或是其他形式的一一做分类记录。与编码工作有关的问题有两个,一是要选择编码的单位;二是要制定一份编码单。
选择编码单位,即是选择具体的观察和点算单位。要注意把它与研究的分析单位加以区别。本书第四章曾指出,分析单位是研究所描述和解释的对象。它既可以是内容分析中的编码单位,也可以不是。
编码单是对文献材料进行观察和记录的工具,在某种程度上,它同结构式观察所用的记录单十分相似。它的形成和结构将要依赖于编码单位的选择,比如,如果编码单行是短篇小说的中心人物,研究者就必须为每一个人物准备一份编码单;如果编码单位是场完整的电影,研究者必须为样本中的每一部电影都准备一份编码单。
一旦选定了编码单位,研究者就要为它们制定或赋予数值。分类的基本要求同问卷中的答案编制要求一样,有两条原则:一是每一事实或材料——无论是小说的中心人物,还是书籍中的单词,报纸杂志小的文章或其他类似的东西——都必须仅仅只能归于某一类。
许多社会学研究者的研究实践表明,在对文献的内容进行阅读以便编码时,阅读者即编码者,常常会因为阅读顺序的影响而在评价标淮上形成某种定势或者惯性,影响到所分析文献评价上的统一性和客观性。为了避免这种情况发生,我们可以打乱文献原来的顺序,随机地确定这种顺序。
第三节 二次分析
一、二次分析的含义 、
二次分析也称第二手分析,指的是对那些由其他人原先为别的目的收集和分析过的资料
所进行的新的分析。这种新的分析主要有两种类型,分别为着两种不同的研究目的,一种是从别人为研究某一问题而收集的资料中,分析与该问题所不同的新的问题,即把同一种资料(已有的、别人的研究所收集的资料)用于对不同的问题的分析和研究中。另一种类型则是用新的方法和技术去分析别人的资料,以对别人的研究结果进行检验,即用不同的分析方法处理同一种资料,看看是否能得出同样的结论。
二次分析所用的资料是别的研究者或研究机构通过实地调查所得到的原始数据,以及各种统计部门所编制的统计资料。由于电子计算机在社会研究中的普及和应用,社会研究人员分享各种实地调查和统计所得的大量数据资料成为可能。从20世纪60年代开始,利用第二手资料的研究在国际规模上得到发展。许多研究中心和研究机构相互协作,形成了数据档案网。录好原始数据的磁带和输入卡被存入档案库,就像传统的图书馆收藏图书一样,供广泛交流和使用。不同的是图书馆的书籍要靠借阅的办法,而数据档案库里的数据资料则需要复制和购买。
二、二次分析的步骤
1.选择研究的主题
适用于二次分析的主题可以是相当大的,它有时仅仅只能采用那种在一个国家规模上所得到的数据资料。一旦你提出了某个假设或某种研究问题,就必须仔细地考虑操作化工作。哪些控制变量是关键性的,因变量是不是必须以某种特定的方式进行测量?通常,在你的研究设计中,要留有一定的余地,以便一旦发现相关的资料中并不具备你所想要的各种特征时,就可以稍微修改你的研究设计,以保持与可用资料的一致性。
2.寻找合适的资料
由于二次分析所用都是原始调查或统计所得到的数据资料.因此我们应该对这种资料的主要来源有所了解。在我国,目前尚还缺乏这样的数据资料库,因而所能利用的大多是国家统计部门所收集的资料。
对于二次分析来说,明确所寻求的资料十分重要。也许—个研究人员寻找和发现潜在的、具有吸引力的资料来源的最好途径,是去阅读一份相关的研究,因为有那么多公开发表的研究都是来源于大规模调查的分析,你可以通过查阅过去一段时期的研究期刊而得到有关大型调查数据资料的情况。当发现一组对你似乎十分有吸引力的数据资料时,你可以仔细地阅读论文的资料部分对资料的内容、收集方法等等的描述。
3.对资料的再创造
得到所需要的数据资料后,往往要对这些资料进行一些加工才能更好地为自己的研究服务。首先,必须从资料中寻找或重新定义你所要研究的变量。其次,应该仔细地研究这些变量。如果有一份每一变量的频率统计,就可以帮助你加深对资料的了解。
4.分析资料
二次分析的最主要、同时也是最大量的工作,就是对资料的重新分析。在这种分析中.各
种统计分析方法和技术都向样适用。如果把二次分析的方法与调查研究的方法进行比较,可以更清楚地认识这种方法的实质。调查研究往往是研究者根据自己的研究目的去实地收集第一手资料,也可以说他们是先“创造”出资料,然后再对这些资料进行分析。而二次分析则是研究者自己不去进行实地调查,不去“创造”第一手资料,只是根据自己的研究目标在别人己“创造”出的各种原始资料堆中去“寻找”合适的资料进行分析,即只是把别人已“创造”好的资料拿来为自己所用。
三、二次分析的优缺点
二次分析首先具有省时、省钱、且省力的特点。它可以使研究人员从复杂、辛苦的收集原始数据的工作中,以及单调、枯燥的数据登录、输入等工作中解脱出来,以便能集中更多的时问和精力来分析他的资料。二次分析的另一个突出优点是特别适合于比较研究和趋势研究。比如,我们可以通过对不同的研究考在不同的地区分别收集的资料进行二次分析,来对比不同地区的情况;或者把不同的研究考对不同的群体进行调查所取得的资料进行二次分析,来对比不同群体的情况;还可以把其他研究者在不同时期对于同一问题所作的若干次研究的资料聚集在一起进行二次分析,以便研究事物发展的趋势等。二次分析的主要缺点在于其所用资料的准确性或适用性不足。
第四节 现存统计资料分析
一、现存统计资料分析的概念
在社会科学研究中,人们也常常运用各种现存的统计资料来进行自己的研这种现存的统计资料,既可以为研究提供历史背景材料,又可以成为研究本身的数据和资料的一种来源。后一种情况下,研究就被称做现存统计资料分析。
现存统计资料的分析与二次分析有一个相似的方面,这就是它们所用的资料都是别人已收集好的。只是二次分析所用的是原始数据资料,而现存统计资料的研究者则是利用那种以频数、百分比等统计形式出现的聚集资料。
在利用官方统计资料时,应注意两个问题:一是应该对统计资料的内容、对象、范围、特点等等都具有清楚明确的认识。二是对于各种统计指标、比率和数字的实际含义、它们的计算方法等等应十分清楚,不能含含糊糊。否则就会出现错用资料的情况。当我们阅读或使用某个统计数字时,总是应该问一问这个数字所代表的实际内容是什么。
二、现存统计资料分析的例子
利用现存统计资料进行分析和研究的最著名的例子,应该说是法国社会学家迪尔克姆一百多年前对自杀现象的经典性研究。迪尔克姆选择了对这些统计资料进行分析的研究方式。他查阅的记录越多,各种不同的模型就越是明显地展现在他面前。所有这些模型他都十分感兴趣。首先引起他注意的是自杀率的相对稳定。查阅了好几个国家的资料后,他发现自杀率年复一年几乎总是相同的。他还发现夏季自杀的发生率比其他季节多得多。这一点启示他,也许温度与自杀有关。如果真是这样,那么,南欧国家的自杀率就应比北欧国家高。但他发
现情况并非如此。自杀率最高的既不是南欧国家,也不是北欧国家,而是一些中纬度国家。因此,温度似乎不是自杀的原因。终于,他从不同的资料中发现了—个重要的模式:尽管自杀率具有相对稳定性,但是,政治动乱时期自杀率会突然增高。迪尔克姆通过对一系列不同的数据进行分析,使这个一般性的假设更加明确、具体。从各种类似于宗教与自杀间关系的其他具体表现中,抽象出“社会整合程度”的概念,说明自杀现象是社会整合程度的一种反映。他得出结论:社会整合程度越高,自杀率就越低;反之,社会整合程度越低,自杀率就越高。
三、现存统计资料分析的主要步骤
1.选择合适的材料
许多研究常常要求大量的聚集资料与此相适应。比如,任何涉及全国范围内某种社会现象的趋势的研究,都要求这种资料。如果你所研究的问题可能与某种聚集资料相适应,那么,你必须仔细地考虑能够用来回答这一问题的统计证据的类型。要从各种调查统计部门所统制的现存统计资料中,选择最适合你的研究问题、最有代表性和最有说服力的证据。
2.处理资料
由于聚集资料都是基于一定的基础之上建立起来的,所以,把它们分解开来通常是不可能的。我们通常所能做的,是比较那些基数较小的单位,比如说省、市为单位的合计资料中的信息。我们只能在现有统计资料本身的结构中去发现、发掘和利用,特别是从不同的角度来利用。
3.说明资料来源
现存统计资料分析中的一个很重要的工作,就是要说明所用的现存统计资料的来源,并使这种资料能够被理解。
四、现存统计资料分析的效度和信度
只要我们的研究所依赖的是对现存统计资料的分析,那么,我们必然会受到现存统计资料内容的限制。通常,现存统计资科并不能准确地包含我们所感兴趣的资料,而我们的测量对于我们所希望得出的结论来说,也常常不能成为我们所研究的变量和概念的有效的代表,因此,逻辑推理和重复验证这两条科学的原则,对于保证现存统计资料分析的效度来说是极其重要的。在现存统计资料分析中,一点小小的独创和推理常常可以发现好几个有关假设的独立检验标准,如果所有这些检验都表现出一致的结果,那么,证据就有力地支持了你的结论。
第五节 文献研究的特点
一、文献研究的优点
(1)无反应性。文献研究不会打扰研究对象,也不会对这些研究对象发生影响。
(2)费用低,省钱省时。尽管进行一项文献分析的费用会依所分析的文献的类型、文献散布的广度、获取文献方式的难易程度等方面的差别而有所不同,但是,一般来说,它比进
行一项大规模调查、一项严格的实验、或一项深入的实地研究所需要的费用要少得多。
(3)可以研究那些无法接触的研究对象。
(4)适于作纵贯分析。由于调查、实验、观察等方法所研究的都是现时的情景,因而往往难于用来进行纵贯研究或趋势研究。文献研究在这方面则有着它特别的优势:随着时间的流逝,各个不同历史时期的社会现象和社会生活,或多或少总会以各种不同的文献形式记录和描述下来。
(5)保险系数相对比较大。在内容分析中,弥补过失比起其他研究来就容易得多。你只需要对你所用的资料重新进行编码或进行统计处理,而不用一切都从头开始。
二、文献研究的缺点
(1)许多文献的质量往往难以保证。无论是个人的日记、信件,还是报纸上的各种报道文章直至官方的统计资料,都常常隐含着由个人的偏见、作者的主观意图以及形成文献过程中的客观限制所形成的各种偏误,从而影响到文献资料的准确性、全面性和客观性,影响到文献资料的质量。
(2)有的资料是不易获得的。由于许多文献都不是公开的和可以随意获得的,因此对于某些待定的社会研究来说.往往很难得到足够的文献资料。
(3)许多文献资料由于缺乏标准化的形式,因而难于编码和分析。有些文献比如报纸杂志,经常以一种标准的形式出现,因而编码和分析起来就比较容易。既可以进行纵贯的对比研究,也可以同其他报纸杂志进行横向的对比研究。但是,其他许多文献特别是个人文献,却不具有这种标准的形式,他们的撰写目的不同,内容或对象不同,长度、语言等表达形式的不同等待,都给研究人员进行编码和分析带来了很大困难。
(4)效度和信度存在一定问题。研究者对文献资料进行编码的结果是否的确反映了它所希望研究的概念或希望研究的变量呢?很多时候并非如此。因此,效度是内容分析的一个常见问题。