信息组织知识点汇总
知识点汇总
第一章
1、信息组织的定义
以用户需求为导向,依据信息体自身的属性特征,信息工作者或用户按照一定的原则、方法和技术,将杂乱无章的信息整理成为有序的信息集合的活动和过程。
2、信息组织的原理
基本原理:
如果有若干自然状态的无序信息资料,将这些信息资料按照某种属性特征排列成一个序列,并且需要使用信息资料的用户能将自己的需求转换成相应的信息资料属性特征,并在排列后的信息资料序列中到自己所需要的信息资料。
信息组织由信息著录标引(信息描述揭示)和信息序化两个工作环节组成。
3、信息组织的内容
一般而言,信息组织包括四项内容。
1.信息筛选(甄别有用信息,剔除无用信息)
2.信息分析(对信息的内外部特征进行细化、挖掘、加工整理并归类)
3.信息描述与揭示(对信息资源的部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录的过程)
4.信息整序与存储(按照一定的格式和顺序存储在特定的载体中)
4、信息组织的类型
按信息的认识层次划分,信息组织有三种类型
1.语法信息组织(研究语言符号之间的形式范畴的结构规则,如:字顺法、代码法、地序法、时序法)
2.语义信息组织(研究信息的内容特征的组织方法,如:分类法、主题法)
3.语用信息组织(研究环境与使用者的不同而不断变化的信息,如:权重值信息组织法、概率组织法)
5信息组织的作用
控制整序
提升品质
传播利用
节约成本
第二章
1、熵(entropy)
最早是热力学上的一个符号,是一种测量在动力学方面不能做功的能量综述。熵指的是混乱的程度,负熵是物质系统有序化、组织化、复杂化状态的一种量度。香农第一次将“熵”引
入到信息论中,在信息论中,“熵”可以用作某件事不确定度的量度。信息量越大,体系结构越规则,功能越完善,熵就越小。利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储等活动。学术界目前普遍接受的观点是“信息即负熵”。
2、逻辑学原理信息组织中的应用
概念之间的关系(图略):
相容关系
同一关系:是指有相同外延的两个概念之间的关系。
包含关系(属种关系:是指这样两个概念,其中一个概念完全被包含在另一个概念的外延里,是另一个概念外延的一部分。包含另一个概念的概念(外延广的概念)对被它包含的概念(外延窄的概念)来说是上位概念或属概念,被包含的概念对包含它的概念来说是下位概念或种概念。
交叉关系是指有一部分外延重合的两个概念之间的关系。
不相容关系
并列关系:是指同一个上位概念(属概念)之下的几个不存在共有外延的下位概念(种概念)之间的关系。
矛盾关系:这是概念并列关系的一种特殊形式,是指外延总和等于其上位概念全部外延的两个并列概念之间的关系,非此即彼,没有第三种情况。
对立关系(反对关系):也是概念并列关系的一种特殊形式,是指外延总和小于其上位概念全部外延的两个并列而且是相互对立的概念之间的关系。
第三章
1规范语言
定义:规范语言从自然语言出发,根据信息描述与信息检索的需要,从自然语言中筛选出特    定的词汇来网罗和指示概念,并依据一定的规则对自然语言进行事先规范而形成的人工语言,是符号化的概念表示系统。规范语言也称为受控语言、人工语言。
规范语言是人工控制的语言系统,词汇控制和句法控制是核心所在。
规范语言的词汇控制
(1)词汇的选择:精选、压缩,保留具有检索意义的词汇,尽可能地控制词汇规模。
(2)词形的控制:实现词义和词形的唯一性。
(3)词义的控制:采用加限定词或加注释的方法让词汇与概念一一对应。
(4)词间关系的控制:采用索引、图示系统或参照系统来揭示词典中语词间关系。
规范语言的句法控制
(1)引用次序/组配次序:显著性引用次序、范畴职能引用次序、上下文从属引用次序
(2)控制符号:联号、职号、关系符号、加权      例: 537+621.3
(3)句式变换:检索词轮排转化。(机检时代已经变得无足轻重)
2、规范语言的类型:
按照结构原理分
分类语言:等级体系式、分面组配式、等级-组配式
主题语言:标题法、单元词法、叙词法
代码语言:化合物分子式、档案号、专利号
按其标识的组合使用法分
先组式语言:语词标识在编表时就固定组配好
后组式语言:检索时进行临时组配
3、自然语言(关键词、自由词和出现在文章题名、摘要、正文和参考文献中的具有实质意义的语词)
自然语言的复兴——“以用户为中心”
自然语言的应用:自然语言处理、自然语言标引、自然语言检索。
自然语言的不足: (1)概念与语词不是一一对应的关系。
                (2)概念之间的关系具有隐含性,缺乏对词间关系的揭示与描述。
                (3)检索效率直接与用户的认知水平相关。
后控制词表——弥补自然语言的不足
        “后控制模式”=“标引不控制”+“检索后控制”
自然语言系统中的三种后控制词表方式:
(1)用户检索前通过浏览后空词表选择合适的检索词构造检索式/检索负担较重;
(2)由系统自动执行调整检索式/受限于自然语言处理技术;
(3)系统根据用户输入的自然语言检索式从后控制词表中给出相关词,供用户选择来调整检索式/交互式,是目前最常用的一种后控方式。
4、分类法的类型
(1)等级列举式分类法:依据传统的知识分类体系编制,也称为体系分类法
              例:《杜威十进分类法》DDC
                        《美国国会图书馆分类法》LCC
                        《中国图书馆分类法》
(2)分面组配式:依据概念的分析与综合原理,组成“分面-亚面-类目”的结构体系
                  例:《冒号分类法》(Colon  Classification)
(3)列举组配式:在等级列举式的详尽类表的基础上,采用组配方式的分类法
                  例:《国际十进分类法》UDC
5、分类法的结构体系
6复分表
作用:(1)缩小类表的篇幅;(2)加强类表的灵活性;(3)增强类表的规律性。
复分表分通用复分表(标准复分表、地区复分表、时代复分表……)和专类复分表
7、分类法的标记系统
标记符号通常可以分为单纯号码和混合号码两种。
几种特殊的标记方法(了解其含义和原理
八分法、双位制、借号法、预留空号法、双位加点法……
8、国内外常用分类法:
《中国图书馆分类法》
《杜威十进分类法》DDC
《美国国会图书馆分类法》LCC
《国际十进分类法》UDC
《冒号分类法》(Colon  Classification,CC)
要点:名称、大致概况、基本类目、标记符号制度等。
例如:《中图法》有五个基本部类,22 个基本大类,混合号码制标记符号,8个通用复分表……
9主题法
(原理)主题法是直接以表达主题内容的词语作主题标识、以字顺为主要检索途径,以主题为中心集中信息资源,并通过详尽的参照系统等方法揭示词间关系的标引和检索方法。
主题法的类型
按照选词方法划分:
    标题法      元词法      叙词法      关键词法    ……
计算机语言种类
10、叙词 ——概念组配式叙词法最基本的原理
叙词之间的关系
等同关系(正式叙词  非正式叙词)                参照符号  Y  D
等级关系(上位概念主题词  下位概念主题词)      参照符号  F    S
相关关系  (类缘关系,语义相关)                  参照符号  C
11国内外常用主题词表
《美国国会图书馆标题表》(LCSH),世界上使用最广泛、最具影响的标题词表
《汉语主题词表》
《中国分类主题词表》
12、《汉语主题词表》款目样例:
第四章
1、几个概念:
著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。
款目是指依据一定的规则和方法,对文献特征与编目业务信息所做的记录,包括描述项目、检索点、编目业务注记三部分信息。
记录是指表述事物的特征,具有完整的含义,从内容和使用的角度能被作为一个整体来识别的一组相关数据项的组合。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。