杨裕民
2023-02-02
更新时间:2023-03-22 01:16:58作者:百科
[拼音]:houguifanhua qingbao jiansuo yuyan
[外文]:postcontrol information searching language
标引时从正文中抽出自由词(也称关键词)作为检索词,然后对这些自由词进行标准化处理的一种情报检索语言。它由标引规则和自由词表组成。
标引规则是从正文中抽取自由词的原则规定。包括:
(1)选词原则,指要选择具有检索意义、概念完整的自由词作为检索词。 ② 词组拆开组配与保留词组原则,即当一个词组是由概念上为整体-局部关系、 概念交叉关系和事物及其行动、过程、工艺、性能等关系的两个词组成时,应拆开作为单独的自由词标引,其他情况则作为一个自由词标引。
(3)最大专指度标引原则,即按作者所述主题中的专指词组选择自由词。
(4)上位词标引原则,是指按最大专指度原则标引后,如果已标引的自由词中能抽出概念内涵较浅且具有独立检索意义的词,也应作为自由词标引。例如,已标引“快速数字滤波器”一词时,还要求标引“数字滤波器”和“滤波器”二词。
(5)同义词标引原则,是指同一概念在正文中出现的所有同义词都可选为自由词。
自由词表对已标引的自由词进行规范化处理后编成的控制词表。一般由同义词族和宏词族两部分组成。也有一部分自由词表只包括同义词族。同义词族指将一个数据库中标引的同一概念的两个以上同义词之间建立起相互参照关系。宏词族指将概念内涵相同但字面不同的一组词,选概念最浅的自由词作为族首词,其余词作为其下位词构成的二级词族。如家禽、鹌鹑、鹅、鸽、火鸡、鸡、鸭和珠鸡一组词中,选“家禽”作为族首词,其他词作为下位词构成的二级词族就是“宏词族”。宏词族是指其下位词之下还可能有许多下位词,如“鸡”,其下位词有蛋鸡、肉鸡等,蛋鸡下位词有产蛋鸡、高产蛋鸡、来航蛋鸡、卵用鸡、罗斯蛋鸡等,肉鸡下位词有爱拔益加肉鸡、安纳克肉鸡、海佩科肉鸡、红羽肉鸡、罗曼肉鸡和肉用种鸡等,肉用种鸡下又有红河谷肉种鸡。所有这些词都不收入“宏词族表”,因为按上位词标引原则,“鸡”以下的词族关系,都隐含在标引的自由词中了。当然,有的自由词表比较简单,只处理词间的同义关系,不处理种-属关系。
后规范化情报检索语言是计算机情报检索的产物,目前在利用关键词或自由词检索系统中,越来越多地被采用。随着自然语言情报检索系统的发展,这种语言的研究和应用会更广泛地受到重视。