文献检索和利用201501
文献检索
宋天华 TEL:86281175 [email protected] 哈工大图书馆信息咨询部 414室
文献检索与利用
什么是
为什么
怎么学
什么是
文献检索与利用
文献:古代产生,现代的解释
定义
文献是记录有知识或信息的一切载体。
● ● ● ● ● ● ●
检索:是根据特定的学习或研究需求,运用检索 工具,按照一定方法,去查找资料或信息的过程。 利用:阅读、分析检索出的文献,发现科学问题, 学习吸收知识,解决科学问题及创造新知识,最后 按照科学范式形成“知识产品 ( 文献 ) ”的过程。
文献检索与利用
为什么
时代的要求!
信息爆炸
50% ~ 60%年增长速度
全面学习观、自主学习观、创新学习观和终身学习观. 学会学习:教育观念、学习观念和生存观念
大学前的指令性、计划性、封闭性学习 大学后的指导性、自主性、开放性学习
独立学习,大量查阅。 探究式学习,知识创新。
大学学习方式转变的必然要求!
怎么学
文献检索与利用
其它课:具体的知识
文检课:学习获取知识、分析问题、创造新 知识的方法与过程
课程要求
基础/核心课程:培养信息素质与科学素质. 提高自主学习、创新学习、终身学习能力,培 养基本科学研究的能力。 要求: 认真听课、做好实践课作业、多实践。 总成绩: 平时( 实践课作业30、考勤10 )40+ 课程设计 60=100 安排: 3次讲授+3次实践课+课程设计(6周) 第10、12、14 周的实践课在图书馆212机房。
课程邮箱
[email protected] 密码(password):hgd2014 下载课件 接收通知 课程交流
教学参考书
指定教材:《大学信息素质基础》,由哈工大 图书馆文献检索课教学组编,在图书馆 414/105室购买,以班级为单位组织购买. 电子教材:图书馆电子书有很多 例如:科技信息检索与利用/王立诚主编, 2006年 超星下载 .
课程内容安排
第1部分 文献与检索基本知识 第2部分 中文电子图书检索与利用 第3部分 中文电子期刊与学位论文检索与利用 第4部分 中文专利检索与利用 第5部分 国外数据库检索与利用 第6部分 综合:科学论文写作、实践课、课程设计 (课外)
第1部分文献与检索基本知识
1. 文献基本知识 2. 检索的基本理论
查什么? 到哪里查?
如何查?
1基本概念
1.1 信息(information)的基本概念
信息论创始人申农:1948年在《通信的数学理 论》中指出:“凡是在一种情况下能减少不确 定性的任何事物都叫做信息(information)。 ”
信息的重要特性:
可共享性及增值性
1.2 信息源
信息源,就是信息的来源。 主要信息源有 文献信息源 网络信息源 实物信息源 人载(口
头)信息源
1.3 文献信息源
1)文献(Literature)的定义 教科文组织 在存储、检索、利用或传递记录信息的过 程中,可以作为一个单元处理的,在载体内、 载体上或依附于载体而存储有信息或数据的载 体 综合定义 记录有知识、信息和数据的一切载体叫文献。
文献的要素: 1)要有一定的数据、信息、知识内容; 2) 文献中的符号系统指图画、文字、公式、图 表、编码,声像和电磁信息等。 3)要有用以保存和传递知识的记录方式。 种类很多,如写画、雕刻、印刷、摄制、录 音等.
4)要有记录知识的物质载体,如纸张、感 光材料、磁性材料和网络存储器等。
1.4 文献的类型与形式
文献类型可以从四个角度划分
载体形态
加工程度
文献
出版形式
获取难易
按载体形式分
刻写型:甲骨文、金文、手稿、信 印刷型:书刊、报纸 缩微型:缩微胶片、缩微平片 机读型:数据库、电子书、 计算机文件、光盘 声像型:录音带、录像带、胶卷
按文献的出版形式划分为
(1)图书 (2)期刊 (3)专利文献 (4)学位论文 (5) 会议文献 (6)技术标准 (7)科技报告 (8)政府出版物 (9)技术档案 (10)产品说明书
●图书(book):凡篇幅达50页以上并构成一 个书目单元的正式出版物称为图书。它的特 点是主题突出,内容系统,论述全面深入, 知识成熟稳定,有统一的ISBN号。但出版的 周期长,因而其内容一般就缺乏最新的研究 成果。
●期刊(Periodical,Journal,Magazine:)期 刊又称杂志,它是指定期或不定期连续出版 的、有统一的名称、固定的版式、有连续的 序号、汇集了多位作者分别撰写的多篇文章, 并由专门的机构编辑出版。它具有出版周期 短、刊载数量大、内容新颖、发行广泛等特 点,科技期刊是最重要的一次文献。
专利文献(patent):专利文献是记录有关发明 创造信息的文献,蕴含着技术信息、法律 信息和经济信息。广义的专利包括专利申 请书、专利说明书、专利公报和专利检索 工具,以及与专利有关的一切资料;狭义的 专利仅指各国专利局出版的专利说明书。 专利文献具有新颖性、创造性、实用性三 大特点。它内容详尽、具体,并有附表, 往往反映一个国家当前科学技术研究的最 新水平。
●学位论文Dissertation:指高等院校、科研机构的毕 业生或研究人员为申请授予学位而撰写的学术研究 论文。学位论文内容系统、完整、详细,但一般不 公开发行。 ●标准文献Standard:是按规定程序制订,经权威机 构或主管部门批准的在特定范围内执行的规格、规 则、技术要求等规范性文件。 特点:(1)标准的制订、审批
程序有专门规定, 并有固定的代号; (2)一个标准一般只能解决一个问题; (3)时效性强; (4)不同种类、不同级别的标准在不同范 围内执行; (5)有一定的法律效力和约束力;
●会议文献(Conference Paper):指在国内外 各专业学术会议上发表的论文或报告。具有 内容新、专业性强、质量高的特点。它反映 了科学技术的最新成就和研究动态。
●科技报告:是关于某项科学研究成果的 正式报告或是研究过程中对某一阶段进展 情况的实际报告。它的内容比较深、具体, 大多涉及尖端学科,具有较强的保密性。 科技报告不定期出版,一个报告为一个单 行本,有统一编号。 ●政府出版物:指由国家政府部门及其所 属专门机构出版发行的有关文件资料。 特点:(1)内容广泛,涉及各学科领域; (2)具有正式性、权威性; (3)售价低廉。
●科技档案:指科研机构或技术生产部门在 从事科研生产中所形成的技术文件。它的内 容准确、真实,具有保密性和内部使用的特 点。 ●产品资料:指对定型产品的性能、结构原 理、规格、用途、使用特点和维修方法等所 做的具体说明。它具有直观性、技术成熟、 数据可靠、出版迅速的特点。
按加工程度分
零次文献 零次文献 一次文献 • * 还未形成一次文献的非出版物; 二次文献 • * 论文草稿、谈话记录、实验记录、书信 三次文献 …… • 普通网页,电子邮件等
一次文献:作者以 他本人的科研成果 为依据而撰写的原 始著作。如期刊论 文、学位论文、专 著。
二次文献:将分散 的、无组织的一次 文献加工、整理、 简化,并按一定原 则组织,以便于查 找利用的文献。如: 索引、书目/目录、 题录、文摘。
三次文献:根据特定的需 要与目的,选择一定范围 的一次文献,并对其进行 分析、浓缩、综合或加以 评论而形成的文献。
如:词典、百科全书、教科书、综述 、评论等
按获取难易程度分
1.5 文献分类与组织
文献分类的意义
整理与组织文献的规则
文献信息检索的基础
广义意义上属于文献检索
分类法
分类法 文献分类法是按文献的主题内容、 形式、体裁和读者用途等,在一定的哲学思想 的指导下,运用知识分类的原理,采用逻辑方 法(层次型或树型)编制出来的。 这是一种从总到分、从一般到具体,层层 划分、逐级展开的分门别类的符号代码体系。
国际通用两部分类法
杜威十进分类法(DDC) 全球135个国家使用,美国95% 图书馆,按学科分类,共分10个学科。 国际十进分类法(UDC) 欧洲第一部分类法,世界上 规模最大的一部分类法。 按学科分
类,共分10个学科。
文 检 课
杜威十进制分类法
000 Generalities 总类 100 Philosophy 哲学类 200 Religion 宗教类 300 Social sciences 社会科学类 400 Language 语文类 500 Pure sciences 自然科学类 600 Technology 应用科学类 700 The arts 艺术类 800 Literature 文学类 900 General geography & history 史地类
国际十进分类法
0 1 2 3 4 5 6 7 8 9
总类、科学和知识 哲学、心理学 宗教、神学 社会科学 (语言) 数学和自然科学 应用科学、医学、技术 艺术、娱乐、体育 语言、语言学、文学 地理、传记、历史
IPC简介
IPC( International patent classification)国际专利
分类
IPC根据1971年签订的《国际专利分类的斯特拉斯堡协定》编制的,是目 前唯一国际通用的专利文献分类和检索工具
截止到2007年末, IPC联盟拥有58个成员。实际100多个国家、4 个地区局、1个专利组织使用IPC。我国于1997年正式加入。
标示
设计一种管理专利文献的办法,将相同技术主题的专利 文献归档,给予统一的标识,在需要的时候,通过这一
标识找出这些文献。
35
IPC分类
国际专利分类表八个部所涉及的技术范围 是:
目前,共有7万个小组。 ——A部:生活需要 ——B部:作业;运输 ——C部:化学;冶金 ——D部:纺织;造纸 ——E部:固定建筑物 ——F部:机械工程;照明;加热;爆破 ——G部:物理 36 ——H部:电学
IPC分类
部、大类、小类、大组、小组 每一等级:类号、类名 下一等级继承上一等级的类号(小组继承 “/”前的数字)
C 部 08 L 69/00 聚碳酸酯的组合物 大类 小类 大组 67/04 由羟基酸得到的聚酯,如内酯 小组
37
中国图书馆分类法
《中图法〉所依据知识分类的原理,把全部的知 识门类分为马列、毛泽东思想;哲学;社会科学; 自然科学;综合性图书这五大部类,在此基础上 建成了由 22 个大类组成的体系系列。在大类的基 础上,逐级展开为384个小类,用字母和数字表示。 根据需要再逐级细分,形成了严密的分类体系。
马列毛邓 哲学
A B D E 军 事
P 天 文 地 球
中国图书馆图书 分类法示意图
F 经 济
Q 生 物 科 学
人 类 的 知 识
社 会 科 学
C
社会 科学 总 论
G
H
I
J
K
政治
法律
教 语言 文 文 文字 学 体
R 医 药 卫 生 S 农 业 科 学 T 工 业 技 术
艺 历史 术 地理
U 交 通 科 学 V 航 空 航 天 X 环 境 科 学
自 科 然 学
N
自然 科学 总 论
O 数 理 化
综合性
Z
举例:英语四级词汇
1语言 0 语言学 2文字 1基本词汇
● ● ● ●
2同义词
● ● ● ●
1 汉语 2 中国少数民族语 H语言文字
3 常用外语
● ● ● ●
1英语
● ●
3语义、词汇、词义
● ●
2法语 3德语 4西班牙语 …… ……
4语法 ……
3俗语 ……
………… …………
确定分类号:H313.1
文 检 课
索书号/索取号 由分类号与书次号构成. 表达了个体图书馆的唯一种图书或文献.
高等数学 /熊光莹 锁定文献的唯一物理位置 O13 哈工大图书馆 2294
书次号
.
著者号
四角号码 汉语拼音号码
种次号
检索结果:H313.1/124 《大学英语四级词汇巧记》
东华大学出版社 2011
书库图书和期刊都是按《中图法》分类号顺序 排架的,以TP3计算机技术为例:
TP3计算技术、计算机技术 TP34电子模拟计算机 TP39计算机的应用
TP30一般性问题
TP35混合电子计算机
TP31计算机软件 TP32一般计算器和计算机
TP36微型计算机
TP37多媒体技术与 多媒体计算机
TP38其他计算机
TP33电子数字计算机)
排架示意图
2. 文献检索基础
2.1文献检索基础(信息检索) 广义的文献检索包括 “文献的存储与检 索” 。 狭义的文献检索指依据特定的需求,按一定 的方法,从已经搜集并组织好的大量有关信 息的文献集合中,查找并获取特定的相关文 献过程。
信息检索原理:信息检索的过程往往需要一个评价反馈途径, 多次比较匹配,以获得最终的检索结果。其图示如下:
文献检索
文献组织
二次文献
文献检索语言 描述检索系统中信息的内部及外部特征专门 语言,是检索者和检索系统交流的工具,是根 据文献加工、存储与检索的需要,规范化的人 工语言。 在信息组织与存储中,形成检索标识; 在检索过程中,检索提问标识(如检索词)。 检索标识和提问标识相匹配,即为命中文献。
不同的检索语言构成不同的标目及其索引系统,提供各种检索点。
2.2 计算机信息检索技术
(1)布尔逻辑检索 最早的检索理论和应用最广泛的检索技术。 它通过对布尔逻辑运算符进行组配,形 成检索式,用以表达用户的检索需求,并通 过一定的算法和手段进行检索。
逻辑“与” 逻辑“与” 是一种用于交叉概念或限定关 系的组配,它可以缩小检索范围,有利于提 高检索的专指性。 用“并且”、空格、and或“*”表示。 如欲查汽车用计算机方面的文献,可表示 为: “汽车 and 计算机”或“汽车*计算机”。
逻辑“或” 逻辑“或” 是用于具有并列概念关系的组 配。这种组配可以扩大检索范围,防止漏检, 提高查全率。 用OR,或者,“+”表示。 例如,检索计算机方面的主题,则 检索表达:计算机+电脑+computer
逻辑“非” 逻辑“非” 是用于从某一检索范围中排除 不需要的概念。这种组配可以缩小检索范围。 用“NOT”“不包含”“-
”表示 例如,只查机动车但不要电动车的文献集 合中,可表示为:“机动车 NOT 电动车”或 “机动车 -电动车”。 运算优选级顺序为NOT,AND,OR,但是可 以用括号改变它们之间的运算顺序。 例如,(A OR D) AND B,表示先执行“A OR D”的检索,再与B进行AND运算。
检索表达式
是一种表达信息需求范围的抽象和形式化的公 式,是用各种检索算符精确地表达用户的信息 需求。 目的: 一是使他人和自己能看懂信息需求; 二是指导检索实践或者直接用于计算机处理。 信息检索表达式由检索词和布尔逻辑运算符 (and\or\not)及 其它运算符(如:括号、截词符)组合构成.
检索语言表达式
1.指令驱动方式 2.菜单驱动方式 3. 表格驱动方式 4.混合驱动方式
(k=(cad+cam))*(t=雷达)*(r=机械-k=模具)
检索表达式的编制(续)
根据课题涉及到的概念(包括隐性概念)提 取关键词,扩展关键词的同义词、近义词, 同时写出英文对照的检索词 太阳能/日光能/新能源/绿色能源 根据关键词的逻辑关系编制检索式
进入数据库中检索,查找检索结果的数量 和相关性如何,并进一步调整检索策略
案例:数字化城市污水处理厂的建设 1 分析出主题词和关键词
主题概念一:数字化/电子化城市/信息化城市/网络化城市/e城 市 “or” / “+” 主题概念二:污水处理厂/污水处理站 “or” “+” and/ * 主题概念二:建设/建造 “or” / “+”
2 制订检索式 (数字化城市+电子化城市+信息化城市+网络化城 市+e城市)*(污水处理厂+污水处理站)*(建设 +建造) 3 检索实施,根据检索结果进一步调整检索策略
2.3 文献信息检索程序
文献检索就是根据一定目的,使用合适的检索 为什么查 工具,主动获取文献信息的过程.具体的检索 到哪里查 结果的处理 过程可以通过五步来实现。 查什么 如何查
分析 检索 课题 选择 检索 系统 制定 检索 策略 检索 实施 与 调整 获取 原始 文献
1)分析检索课题,明确检索目的 ⑴ 为何进行检索? 参考学习(全),技术攻关(准) 了解动态(新),评奖查新(全,准) 确定对检索结果(全、准、新)的 要求 ⑵ 目标是什么?(查什么) 文献,还是具体的数据或事实。 以确定使用工具书还是检索工具。
已有线索分析 ⑴外部特征:题名、著者、书名、刊 名、出版事项、代码、序号等线索 ⑵主题概念:文献的主题特征 ⑶学科属性:文献所属学科 ⑷文献种类:书、刊、会议文献、学 位论文等等。 是选择检索工具和检索途径的依据(查什 么)
2)选择检索系统和数据库(到哪里查) 正确选择数据库,是保证检索成功的基础
。 可从以下几个方面考虑: (1)学科范围:要有针对性 (2)文献收录:类型、数量、更新、年代 (3)检索功能:检索途径、检索规则、服 务方式、结果处理 (4)国别或语种
3)制定检索策略 (怎么查)
(1)选择检索途径 大多数检索工具都能提供几种主要的检索途径, 如分类、主题词、著者、机构、题名、关键词、摘 要等等。可根据课题要求和已掌握的信息来决定选 择何种检索途径,输入检索词。 (2) 选择检索范围 时间范围、语种、文献种类。
(3)选择检索词(或检索标识) 检索标识就是文献加工的标引词,也是我们在 文献检索过程中所使用的“钥匙词”。它必须在课 题分析的基础上,提取出来,尽可能地全部拟出, 首先选择与检索意图最为切合的词作为检索词,再 根据检索结果需要进行检索调整时,再按照切合程 度而修正检索词的选择。 (4)编制检索表达式 运用布尔逻辑等检索技术,对检索词进行组合 或技术处理,目的是优化检索效果。
4)检索的实施与调整
输入检索式进行检索 检索调整
⑴ 获得的文献太多 :设定限制条 件、特定的检索字段及年代;增加检索 名词的准确性,可查阅工具,如主题词 表、字典、分类表等;修改检索策略, 增加使用AND,减少使用OR。
⑵ 获得的文献太少 :检查检索词的 正确性、准确性;增加检索词的普遍性, 查阅工具,如主题词表、字典、分类表 等; 拓宽检索策略,可减少使用 AND , 而使用OR 连接检索词,增加检索词的同 义词或近义词 ;增加检索数据库,确定 其他数据库是否覆盖你所需要的检索主 题。
(3)检索结果不相关。原因一 般是检索词的歧义造成的,可以 考虑更换检索词或利用词表选择 规范化的叙词进行检索。
5)获取原始文献(结果的处理)
⑴ 利用原文库,直接下载,查找原 文收藏单位,再联系借阅或复制。 ⑵ 利用图书馆纸本馆藏资源. ⑶ 利用馆际互借和原文传递. ⑷ 网络搜索作者信息,与作者直接 联系获取.
文献检索示例
检索题目:4G手机性能
(1)检索目的:了解动态; 已知线索:主题概念 要求具体文献(期刊 、专利、科技成果、标准); (2)选择检索工具:CNKI(期刊 、专利、科技成果、标准等数 据库) (3)制订检索策略 选择检索途径:标题途径 检索词: 4G OR 第4代移动通信 手机 OR 移动电话 AND 性能 OR 功能 通用检索式:(4G+4代)*(手机+移动电话)*(性能+功能) (4)检索实施与调整(略) (5)下载原文(略)
多库综合检索(CNKI)
检索表达式(条件):
CNKI数据库中的检索式:(TI%4G+4代) and(TI%手 机+移动电话)and( SU% 性
能+功能) 检索到:119条记录 数据库:中国学术期刊网络出版总库,中国专利数据库, 国家标准全文数据库,中国行业标准全文数据库,中国标 准数据库,国家科技成果数据库;