Cab Abstracts 中的文献查找利器 ─ CAB Thesaurus

前面我们介绍过 CAB Abstracts 中的“自然语言查找方法”,接下来要介绍另外一种“以 CAB Thesaurus 查找”的方式。“自然语言查找方法”想到什么就打什么,虽然简单方便,但难以避免以下问题:

  • 用词不一致:同样指禽流感,有人使用“bird flu”,有人使用“avian flu”,需将相同概念的各式同义词、狭义词搜集完善,查找文献才不会遗漏。
  • 需过滤不相关文献:我们输入的关键字可能命中文章某处,但完全非文章重点,需花大量时间过滤“出现这个字但实际上并不相关”的文章。

这些问题在“以 CAB Thesaurus 查找”的方法中,应可获得一定程度的改善。

【关于 CAB Thesaurus?】

  • 内容:是一套农学与生命科学的主题词表,为一种索引典,包含物种名称、化学物质、疾病名称、国家地域、学科主题、植被类型、反映作用等 25 万个主题词汇。以英语为主,亦包含德、法、义等外语。
  • 建置时间:1983年建置,迄今持续更新中。
  • 词汇组织:词汇间通过以下关系呈现与组织…

广义、狭义关系:以阶层组织词汇间的广、狭义关系。例如:Mammals 为 Bovidae 的广义词 (Broad Term) ;Bovidae 为 Mammals 的狭义词 (Narrow Term)。

2013-01-18_232300

相关关系:将相关的词汇串连在一起。例如:Dairy cattle 和 Cow housing, Dairies, Dairy breeds, Dairy herds 互为相关词 (Related Terms)。

2013-01-18_233238

常用、罕用关系:将同义异词串联在一起,并指引您用数据库中索引的词汇查找。例如:描述到“甲虫”,“Coleoptera”为常用词汇 (Preferred Term),“Beetles”为罕用词汇 (Non-preferred Term)。这表示想查“甲虫”,应该用“Coleoptera”而非“Beetles”。

2013-01-19_214558

  • CAB Thesaurus 的功用:
    • 组织文献:根据文献内容,在 Organism Descriptor、Geographic Location、Descriptor、Broad Term 四个字段中标注符合的 Thesaurus 词汇。
    • 查找文献:用户可通过 Thesaurus 更精准地查找文献。

【CAB Thesaurus 在哪里?】

CAB Abstracts 数据库主页上方,就有“Thesaurus”的链接:

2013-01-18_233923

点击可进入“Thesaurus”画面:

2013-01-18_233957

—————————————————————————

【CAB Thesaurus 基本操作步骤】

输入欲查找的关键词,点击右方箭头查找,右侧会列出可能的词汇,点击可能的词汇查看:

2013-01-19_232403

进入词汇页面,第一件事,先确认是否有其他“Preferred Term”。以此例而言,“Cow”的 Preferred Term 是“Cows”,表示数据库中和“牛”相关的文献是用“Cows”标注,而非“Cow”。这时应点击进入“Cows”页面:

2013-01-19_232449

进入“Cows”页面后,可再评估该词汇是否符合所需,以及是否有其他更适合的词汇。可切换为“Show Hierarchy”,观看该词汇的所有上、下层词汇:

2013-01-18_235313

– – – – – – – – – – – – – – – – – – – – – – – – – – – –

【补充说明1.】在“Show Hierarchy”的画面中,该词汇的上层词是以冒号“:”表示,冒号数表示相距的层级数。

以“Dogs”为例,其上层词汇显示如下:

: : : : : : : : : : organisms
: : : : : : : : : eukaryotes
: : : : : : : : animals
: : : : : : : Chordata
: : : : : : vertebrates
: : : : : mammals
: : : : carnivores
: : : Fissipeda
: : Canidae
: Canis
dogs

表示“Canis”为“Dogs”的上层词汇;“Canidae”为“Dogs”的上上层词汇,以此类推。

下层词是以点号“.”表示,点号数表示相距的层级数。

同样以“Dogs”为例,其下层词汇显示如下:

dogs
. bitches
. feral dogs
. guard dogs
. . Doberman Pinscher
. . German Shepherd
. . Rottweiler

表示“Bitches”为“Dogs”的下层词汇;“Rottweiler”为“Dogs”的下下层词汇,以此类推。【补充说明1.<完>】

– – – – – – – – – – – – – – – – – – – – – – – – – – –

假设最后决定以“Cows”的广义词“Cattle”更完整地包含各式牛种,点击“Cattle”右侧的“Add”,即可加入右方“Search string”中,列入待查:

2013-01-19_233558

– – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – –

【补充说明2.】在“字段介绍”一文中提过“Broad Term”,只要一篇文章中的“Organism Descriptor”或“Geographic Location” 字段标注了 Thesaurus 词汇,系统会自动在“Broad Term”加上其上层的所有 Thesaurus 广义词。也就是说,文章中的牛种只要属于“Cattle”的狭义词,例如: beef cattle、cows、或 dairy cattle,则这篇文章的“Broad Term”字段中都会自动标记“Cattle”,我们只要用“Cattle”查找,就可以捞出所有“Cattle”、或隶属于“Cattle”的牛种文章。【补充说明2.<完>】

– – – – – – – – – – – – – – – – – – – – – – – – – –

接下来,您可以依前述步骤,再添加其他查找概念。添加的词汇默认会以“OR”逻辑结合:

2013-01-19_235510

当所有概念都已转换为词汇,并添加到“Search string”中,接下来要检查逻辑。以此例而言,假设我要查找“牛的饲养”方面的文献,则“Cattle”和“Animal breeding”之间应以“AND”结合,请手动将默认的“OR”改为“AND”:

2013-01-19_235731

若直接将这串指令“Send to CAB Direct”,系统会在文献中的所有字段比对,尽可能捞出最大的量,因而有可能会捞出一些“出现这个字但实际上并不相关”的文章。建议您在查找指令前加上“Subject:”,并以括号将整串指令包覆,如下:

2013-01-20_000043

– – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – –

【补充说明3.】在“字段介绍”一文中提过“Subject”字段,包含了 Organism Descriptor、Geographic Location、Descriptor、Identifier、及 Broad Term 五个字段。在指令前加上“Subject:”,既可以确保这些查找词只会在以上这些主题相关字段内比对,又不用麻烦地区分每个查找词属于哪个字段,是最好的选择。【补充说明3.<完>】

– – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – –

最后,确认指令无误,点击“Send to CAB Direct”,即可将这串指令送到数据库内,查找相符的文献:

2013-01-20_112040

————————————————————————————————————————————

【用 CAB Thesaurus 查找 CAB Abstracts 的好处】

  • 提供词汇的挑选:有时查数据不知道要用什么关键词,可利用“Thesaurus”,同时根据查到的数据量、词汇间的关系挑选。若查到的文献量太多且不准确,可选择狭义词作更精准的查找;若文献量太少,则可选择广义词、或以“OR”联集其他相关词。另外,您可通过“Preferred Term”知道数据库中常用的用词,作更有效的查找。
  • 层级控制:“Thesaurus”将词汇作广义、狭义的层级控制,并通过“Broad Term”字段放入所有上层词汇,让您可用上层词将所有下层词一次捞出。试想若您想查找“某种药物或疾病对哺乳动物的影响”时,在一般的查找系统,您很难去下达“哺乳动物”这个概念的完整检索指令,因为包含的物种太多太广。但有了 Thesaurus 的层级控制,您只要将“Mammals”放在“Subject”字段查找,其下层的各种哺乳动物都会被包含,十分有助于查找的周全性。
  • 有效排除:如同一开头提到的,在一般的网路搜索中,我们常需花大量时间过滤“出现这个字但实际上并不相关”的文章。然而 Thesaurus 的标注,是经过专人实际阅读文章,确认内容后才进行标注,可以确保内容实际上和这些主题相关。

———————————————————————————

【关键字查找之后,下一步…】

通过本文介绍的“Thesaurus 查找功能”、或另一篇文章介绍的“一般查找功能”,捞出了许多文章后,接下来您可能需要:

  • 找到的文章太多,要进一步筛选过滤?→请参考“Refine Results 功能”。
  • 更多的 CAB Abstracts 介绍请参考“CAB Abstracts 快速指引页”。

By 张育铭

滚动至顶部