检索语言
检索语言
检索语言(Retrieval Language)就是组织文献与检索文献时所使用的语言。也就是说,文献存储时,文献的内容特征 (如分类、主题)和外表特征(如书名、刊名、篇名、号码、著者等)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达。这种在文献的存储和检索过程中,共同使用、共同遵循的语言就是检索语言。实质上它是标引和检索之间的约定语言,是人与检索系统对话的基础,检索的匹配就是通过检索语言的匹配来实现的。使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。检索语言的基本成分是检索词。按检索词的规范化程度和组配程序,检索语言可分为自然语 言(Natural Language)和人工语言(Artificial)两种。自然语言采用的检索词是未加工整理和规范过的,即平常采用的关键词,这种语言又称作关键词语言 (Keyword Language)。 人工语言采用经过规范化的词,规定一个词表示一种事物,例如规定 “aircraft” 表示飞机,而不用“air plane、“plane” 和“aeroplane”,以做到文献存储和检索的一致性。信息检索语言是根据检索需要而创制的人工语言,也称检索标识系统,专门用于各种手工和计算机信息检索系统。从不同角度检索文献,就有不同种类的检索语言,常用的有主题语言和分类语言,下面分别加以论述。
(一)分类语言   
分类语言是用分类号和相应分类款目来表达各种概念的,它以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序。分类语言能反映事物的从属派生关系。便于按学科门类迸行族性检索。
分类语言中最常见的是体系分类语言,它按照学科体系从综合到一般、从复杂到简单、从高级到低级的逻辑次序逐级展开,世界著名的分类法有:《国际专利分类表》(IPC)、《杜威十进分类法》(DDC)、《美国国会图书馆图书分类法》(LC)、《中国图书馆图书分类法》(中图法) 和《中国科学院图书馆图书分类法》(科图法)。
例:一部完整的分类法如《中图法》大体由分类表、辅助表和使用说明三个部分组成。分类表:是选择信息、类分信息、组织信息和检索信息的依据;辅助表:为了帮助用户从信息主题的角度迅速而准确地确定分类号,《中图法》同其它的分类法一样,设置了配套使用工具——辅助表,即《中国图书馆图书分类法索引》;使用说明:就是《中图法》配套使用手册,用于指导用户更好地了解和使用分类表,提高对信息的标引和检索质量。
《中图法》从1974年起在全国试用。目前使用第四版,这种方法将各学科文献分为22个大类,用A到z间的字母表示,但除去L、M、W、Y等四个字母,字母后的小类用数字表示。其中T类、工业技术类用双字母表示
五大部类:马恩列斯;哲学; 社会科学; 自然科学; 综合性图书。
22个大类: A马克思主义 列宁主义 思想;B哲学;C...K(9类)——C 社会科学总论、D 政治 法律、E 军事、F 经济、G 文化 科学 教育 体育、H 语言 文字、I 文学、J 艺术、K 历史 地理; N…V、X(10类)——N 自然科学总论、O 数理科学和化学、P 天文学 地球科学、Q 生物科学、R 医药 卫生、S 农业科学、T 工业技术、U 交通运输、V 航天 航空、X 环境科学;Z综合性图书。
分类号采用汉语拼音字母与阿拉伯数字的混合号码,用一个字母代表一个大类,以字母的顺序反映大类的序列,在字母后用数字表示大类下类目的划分,数字的设置尽可能代表类的级位。
H31:英语
H32
H319:语文教学
H319.4:读物
H0
H1
H3:常用外国语
H(语言)
大类      二级类        三级类   四级类        五级类计算机语言种类
(1)体系分类语言以文献信息内容所属学科的性质来划分和集中文献,能较好地体现学科的系统性,便于人们从某一学科或专业角度查文献。     
(2)体系分类语言的检索标识是国际上广泛采用的拉丁字母和阿拉伯数字,通用性强。     
(3)能较好地反映学科类目划分的纵向层次关系,但不容易反映学科间的交叉、渗透的横向关系,容易导致反映同一主题文献的分散。     
(4)体系分类法主要采用的表现形式为列举式,而列举式很难获得十分完备的类目,加之其严格的逻辑体系又给增加、删减类目造成困难,难以及时满足人们对新学科文献信息的标引和检索的需要。     
(5)在使用分类语言进行标引或检索文献信息之前,必须对分类体系有一定的了解,才能有效地进行。
常用的主题检索语言有标题词语言、关键词语言和叙词语言。主题检索语言的优点在于检索人员不必从知识体系的角度去判断所需文献属于什么学科,只要根据课题研究的对象,直接用能表征、描述文献内容的主题词去查检,而且同一篇文献可用多个主题词来标引,因此扩大了检索途径。
(二)主题语言
用主题词存取文献是最通用,也是最重要的方法,这种方法称为主题法。所谓主题词,是指表示文献内容主题旨意的,经过规范化的词语(包括单词、词组和短语)。主题词不一定出现在论文的题目中,而是指能概括文献内容的基本词语。用来描述主题概念的词语称
为主题词,将主题词按照一种便于检索的方式编排起来,就是主题词表。一部主题词表通常包括字顺表、范畴表、词族表等部分。检索时,像查字典一样,按字顺就可以到主题词。主题法检索语言分为标题词语言 (Subject Heading Language),它是先组式语言 (coordinate Language);叙词语言Descriptor Language)是后组式语言(Post coordinate Language)。
1、标题词语言
标题词语言是主题法中最早出现的一种检索语言。标题词一般是从科技工作者熟悉的大量科技名词中,选出具有实质性意义的科技名词术语,经过规范化处理,使之能够直接地、准确地表达文献的主题内容,使优选的标题词词义在表达概念上具有惟一性,即达到一个标题词只对应一个概念。
(1)标题词的规范化处理
① 同义词规范
 指的是从同义词中优选一个作为标题词,其余同义词为非标题词,不能作检索语言。
② 近义词和反义词规范
 例如,试验和实验是一对近义词,按概念等同处理,从中优选一个作为标题词,其余为非标题词。光洁度和粗糙度 是一对反义词,也只选一个作为标题词,另一个为非标题词。
③ 多义词的词义限制
 例如,疲劳是一个多义词,可以指人的疲劳,也可以指金属材料的疲劳,需要加以区分。为此,用范围注释限制其词义。例如疲劳(生理)、疲劳(物理),前者指用于人的疲劳,后者指用于金属材料的疲劳。
(2)标题词表
 检索系统有相应的词表。其中自然语言体系的禁用词表比较简单,只列出不能作为检索词的词语,实义词均可作检索词。规范化语言体系的词表比较复杂,确定检索词时一定要查对词表。使用词表时应注意以下几点:词表结构与词表各分表 (如字顺表、等级表)的功能及相互关系;词表中参照关系的作用;注释内容的含义、作用;标识符的含义。对上述几点,各词表的导言均有详尽说明。常用词表有 《中国图书馆分类法主题词分类号对应
表》、《美国国会图书馆标题表》(Library of Congress Subject Headings)、《美国化学文摘索引指南》 (Index Guide)等,通过涉猎这些词表,以达到对规范化检索语言的融会贯通。标题词语言是概念组配,它有专指性、集中性、直观性和适应性的特点,适合从事物的主题概念出发进行检索,优于分类法。检索者可以从课题的概念出发,选用标题词直接进行检索,不必考虑学科的分类体系。但是,标题词表中,主、副标题词的数量是一定的,对复杂主题的表达就会受到很大限制。为了适应计算机检索的需要,叙词语言由此诞生。
2、叙词语言
叙词语言是在标题词语言和分类语言的基础上发展起来的一种新型检索语言,它适用于手工检索,但更适用于计算机检索。叙词是指从文献内容中抽出来,能表达文献内容基本概念并经过规范化的名词和术语,特点是具有组配性,通过概念组配来表达主题。叙词语言的基本成分是叙词,它是一种规范化的检索语言,属于后组式语言。叙词语言可用复合词表达主题概念,在检索时可由多个叙词组成任意合乎逻辑的组配,形成多种检索方式。概念组配在计算机检索中常用 “布尔逻辑提问式”来表达,即通过逻辑关系符号将有关叙词组
配成逻辑与、逻辑或、逻辑非等提问式,以表达检索的主题内容。用叙词语言编写的词表称为叙词表,通常是由主表和辅表组成。主表是叙词表的主体,可独立存在。辅表是为便于使用主表而编制的各种辅助索引。主表又称叙词字顺表,它收录全部叙词与非叙词,按词的字顺排列,并标注显示词间关系的参照系统。辅表一般由叙词分类索引和叙词等级索引组成。叙词分类索引也称为分类表或范畴索引,叙词等级索引也称为族系索引或词族索引。常用的叙词表有 《INSPE词表》 (INSPE Thesaurus)、 《NASA 词表》 (NASA Thesaurus)、《Ei词表》(Ei Thesaurus)及我国编辑出版的 《汉语主题词表》等。
(三)关键词语言
关键词是指从文献的题目、摘要或正文中选出的,表征文献主题内容的具有实际意义的词语。将文献中的一些主要关键词抽出作为检索标识,并以字顺排列而组成的查文献用的语言,称为关键词语言。与标题词语言和叙词语言不同的是,关键词语言是自然语言,不需进行规范化处理。关键词索引,就是将文献拆分成几个关键词,然后按照每个关键词的字顺加以排列,以便从关键词入手进行检索。例如,“汽车排气中铅的消除”可以分解为消除、铅、汽车、排气等关键 词。同时,考虑到汽车排气主要与空气污染有关,还可以加上
空气和污染两个关键词。也就是说,从这6个关键词的任何一个入手,都可以查到这篇文献,大大提高了文献的检索概率。当前普遍使用的Internet网上检索就是使用关键词进行检索,只要随意输入一个关键词,就可以在整个网上搜索。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。