医药文献信息检索中的医学主题词检索法研究
医药文献信息检索中的医学主题词检索法研究
摘 要 文章通过pubmed与embase两个检索系统及其各自主题
词表mesh与emtree的对比研究,结合应用实例,阐明了医药文献
信息检索课程中的医学主题词、主题词表及主题词检索法的理解与
应用,使学员认识和了解主题词这种重要的检索手段,同时也通过
对比发现不同检索系统主题词检索的重要意义。
关键词 mesh;emtree;主题词;主题词表;主题词检索法
中图分类号tp39 文献标识码a 文章编号 1674-6708
(2012)80-0211-02
医学主题词检索法是医药文献作息检索的重要手段,即使信息技
术不断发展,在医药文献信息检索领域,主题词检索法都仍在继续
使用,并且与时俱进,持续发展。医学主题词表是情报检索语言(通
常是主题词语言)的具体体现形式,规范的医学主题词表是二次文
献标引的重要依据,根据信息检索原理,标引与检索是信息存储与
获取的两个方面,标引从一定程度上决定了信息检索。因此,医学
主题词表是用户与标引人员间的“指南”。在医学文献信息检索课
程中,医学主题词检索法是医学文献信息的重要方法。pubmed与
embase是医药领域最常用的二次文献检索系统,都包含medline资
源,且都具有医学主题词表,本文以这两个检索系统为例,对医学
主题词检索法进行研究。
1 pubmed与embase
根据2012年最新数据表明,pubmed中经过mesh标引的medline
期刊有5627种,embase包括medline在内的期刊有7961种,这些
期刊全部经过emtree标引。pubmed是世界上使用最广泛的免费检
索medline文献的检索系统,它的学科范围包括生物医学和生命科
学,覆盖护理学、药学、牙科学、生化学、细胞生物学、卫生保健
和兽医学等学科。embase是全球最大最具权威性的生物医学与药理
学文献数据库,包括各种药物和疾病信息,除基础医学和临床医学
外,还覆盖如药物研究、药理学、配药学、药剂学、药物副作用、
毒物学人体医学(临床与实验)基础生物医学、生物工艺学、生物
医学工程与仪器、保健策略与管理、药物经济学、医疗公共政策管
理、公共职业与环境卫生、药物依赖性及滥用、精神科学、替代与
补充医学、法医学和生物医学工程等学科。
2 mesh与emtree
医学词表编制的质量决定了对检索系统的检索效率。pubmed系统
所用词表为mesh,embase系统所用词表为emtree,因embase工作
人员参照mesh于1988年编制了emtree,这两个著名的医学词表有
共同之处,但区别非常明显。对医学词表的比较研究,有益于深入
了解检索系统,而且可以加深对情报检索语言的理论研究。
mesh与emtree这两个词表最大的不同是专指度的差异。专指度是
指主题词与文献主题概念的切合程度,揭示主题词在表达文献主题
的深度和精度方面的能力。词表的专指度直接影响检索系统的查准
率,较高专指度的词表能够帮助用户获得更高查准率的检索结果。
而专指度的高低与词表的主题词数量直接相关,主题词越多说明词
表的专指度越高。如表1所示的收词量上来看,emtree收录的主题
词是mesh的2.4倍,同义词也多出了七万多条,从这一角度能够
反应出利用emtree检索比利用mesh检索会获得更高的查准率。
同一个生物学或医学概念、术语,在两个词表中的地位有较大区
别。通常,emtree使用更多的词语做主题词,而有可能这些词语被
mesh当作入口词来使用,这样mesh的概念体系可能更加清晰,同
时可以防止相关文献在彼此同义或近义的各个词下的分散。但从总
词汇量方面来讲,emtree的词汇数量远远多于mesh词汇数量,对
于用户来讲,更多的词汇意味着易用性更好。而且emtree针对药
物主题词专门设置了17 个核心的药物副主题词和47 种给药途径,
如药物副作用反应、临床试验或药物分析等,增强索引的深度。针
对疾病主题词专门设置了14个疾病副主题词,包括恢复、副作用、
外科手术、治疗等,帮助用户精确地检索疾病的某一类或几类分支
的相关文献, 提高相关性。这些在embase数据库中的文献记录可
以清晰地体现,文献被标引时使用的主题词被分成了药物、疾病和
其他三种类型。
3检索效果比较
本文通过对两个检索系统中主题词扩展检索(即包括被检索词及
其所有下位词的检索)进行测试,比较分析其检出量之间的差异,
进而评价其检索效率,为教学过程中学员理解和掌握主题词检索法
示范,最终为用户选取最佳检索平台提供理论依据和参考。
3.1常见疾病、药物或研究方向等医药概念检索
因pubmed与embase的基本检索都具有检索词自动转换或匹配主
题词功能,故检索结果也同时对比给出基本检索命中文献数。
从表2中我们可以看到,常见疾病如心脏病和糖尿病的检索文献
命中率embase都好于pubmed;常见药物使用商品名芬必得,embase
能够通过商品名匹配到主题词布洛芬,命中文献,pubmed几乎不能
识别芬必得,只有使用布洛芬才能命中约为embase五分之一的文
献。生物学领域的转基因动物研究,embase的命中文献数远远少于
pubmed,可以推见pubmed的生物学领域的文献较多。而2012年诺
贝尔医学奖的研究领域“诱导多功能干细胞”,在embase中收录的
文献数量可观,而pubmed主题词检索的命中文献仅为它的七分之
一多。
3.2专题检索
例:查找相关病毒性胃肠炎(viral gastroenteritis)的药物经
济学(pharmacoeconomics)方面的文献。为查找到较为准确全面
的文献,我们尽量使用主题词检索法和关键词词组相结合的方式。
经分析与实际操作。pubmed中“病毒性胃肠炎”没有主题词,但上
位词“胃肠炎”有主题词,且它有一个“病毒学virology”的副主
题词,故检索式为(”gastroenteritis/virology”[mesh] or
“viral gastroenteritis”) and pharmacoeconomics,命中文
献数为3。为了扩大检索结果范围,使用“病毒性胃肠炎”的上位
词“胃肠炎”,检索式为gastroenteritis and pharmacoeconomics,
命中文献数为62。embase中“病毒性胃肠炎”这一概念有对应的
主题词,故检索式非常简单:pharmacoeconomics and ‘viral
gastroenteritis’,检索效率也高,命中文献数为77条。
在医药文献信息检索课程中通过对mesh与emtree 两个著名医学
主题词表的对比分析与研究,并结合pubmed与embase中的主题词
检索途径的实例检索,帮助学员理解医学主题词掌握主题词检索
法,并能够通过结合主题词表来判断检索系统优劣,最终达到选择
合适的检索系统与检索方法的目的。
参考文献
[1]周晓政.embase.com的检索特色[j].图书情报工作,2005,49
(5):136-139.
[2]于双成.逢大欣与李占兵, medlars与embase所用词表的比较
研究[j].情报理论与实践, 1996,19(5):38-40.
[3]顾萍.pubmed与embase.com检索功能对比分析[j].医学信息,
2006,19(11):1975-1977.
[4]杨淑华.embase.com与pubmed检索medline数据库的比较研究
[j].科学时代,2009(1):71,45.