《文献计量学》知识简介
第一部分:文献计量学初步
一、概述:
1、文献计量学:文献计量学是借助文献的各种特征的数量,采用数学与统计学方法来描述、评价和预测科学技术的现状与发展趋势的图书情报学分支学科。这一术语最早是1969年由英国人A.普里查德提出的。
2、科学计量学:科学计量学是对科学活动过程与管理实施量化评估、刻画和预测的科学学分支学科。这一术语最早是1969年由前苏联科学学家提出的。
3、情报计量学:情报计量学是量化处理情报行为与过程的情报学分支学科。这一术语最早是1979年由德国学者提出的。
经典定律:
布拉德福定律
布拉德福定律是由英国著名文献学家(B.C.Bradford)于本世纪30年代率先提出的描述文献分散规律的经验定律。其文字表述为:如果将科技期刊按其刊载某专业论文的数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个区域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2……的关系。
洛特卡定律
洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写三篇论文的作者数量约为写一篇论文作者数量的1/9;写N篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。该定律被认为是第一次揭示了作者与数量之间的关系。
齐普夫定律
齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。若用f表示频次,r表示等级序号,则有fr=C(C为常数)。人们称该式为齐普夫定律。
普赖斯指数
1971年,美国科学学家D. 普赖斯提出了一个衡量各个知识领域文献老化的数量指标,即后人所称的“普赖斯指数”。就是在某一知识领域内,把对年限不超过五年的文献的引文数量与引文总量之比当作指数,用以量度文献的老化速度和程度。其计算公式如下:
P(普赖斯指数)=被引文献数量(小于或等于5年)×100%/被引文献总量。
文献老化规律
科技文献随着其"年龄"的增长,其内容日益变得陈旧过时,失去了作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利用的过程。科学文献老化既是一种客观的社会现象,又是一个复杂的动态过程。
文献半衰期
文献半衰期是指某学科(专业)现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的。文献半衰期不是针对个别文献或某一组文献,而是指某一学科或专业领域的文献总和而言的。
第二部分:各论
一、 布拉德福定律:也称文献分散定律。是由英国文献学家布拉德福( S.C.Bradford ) 1934 年首先提出。它是定量描述科学论文在相关期刊中集中——分散状况的一个规律。经过后来的许多研究者的修正和研究,发展成为著名的文献分布理论。布氏定律的文字描述为“如果将科学期刊按其刊载某个学科领域的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文量最多的‘核心’区和包含着与核心区同等数量论文的随后几个区,这时核心区和后继各区中所含的期刊数成 1:a:a 2 …… 的关系( a>1 )。”布氏定律主要反映的是同一学科专业的期刊论文在相关的期刊信息源中的不平衡分布规律。布氏定律的应用研究也获得了许多切实有效的成果,应用于指导文献情报工作和科学评价,选择和评价核心期刊,改善文献资源建设的策略,确立入藏重点,了解读者阅读倾向,评价论文的学术价值以节约经费、节约时间,切实提高文献信息服务和信息利用的效率和科学评价的科学性。
二、洛特卡定律:是由美国的统计学家、情报学家洛特卡( A.J.lotka )研究出来的描述科学论文作者动态的最早的量化规律。在科研活动中,不同人的科研能力及其成果著述数量肯定是不同的。那么,在同样的一段抽样时间内,不同的科技工作者的论著数量分布有没有什么规律呢? 1926 年,洛特卡发表了论文“科学生产率的频率分布”。他在文中统计分析了化学和物理学两大学科中一段时间内科学家们的著述情况,提出了定量描述科学生产率的平方反比分布规律,又被称为“倒平方定律”。其经典公式为:
f(x) = ( C 为常数)
上式的意义为:设撰写 X 篇论文的作者出现频率为 f(X) ,则撰写 X 篇论文的作者数量与他们所写的论文数量呈平方反比关系。如撰写了 2 篇论文的作者数量大约是撰写了一篇论文的作者数量的 1/4 (即 1/2 2 ),写 3 篇论文的作者数量大约是一篇论文作者数量的 1/9 (即 1/3 2 ),写 n 篇论文的作者数量大约是写一篇论文作者数量的 1/n 2 。洛特卡定律,探讨了科学论文著者的不平衡分布规律。通过他的研究成果,我们可以明确:在宏观的科学著述活动中,少数作者写出了大量的文章;反之,而大多数人的著述则是不多的。研究科技工作者及其论著间的数量关系有很重要的现实意义。在信息资源管理和信息利用过程中,可以用它来预测著者数量和文献数量,掌握作者的研究动态,提示不同领域中文献现状和趋势,便于对文献信息源进行有效的选择,搜集和科学管理。在科学学中,还可用它来研究科研工作者的创造活动规律,研究人才及其成果分布规律。如普赖斯就从洛特卡定律推论出“杰出科学家数量仅仅是科学家数量的平方根”。
三、 齐普夫定律:是由美国语言学家齐普夫( G.K.Zipf )于 1935 年研究发现的关于文献中的词频分布规律。其具体表述如下:如果将一篇达到一定长度的文章中的词按其出现频率递减排序,根据频率高低编上相应的等顺序号,次最高的为 1 级,其次为2 级 …… ,这样一直到若干级,如果用 f 表示词在文章中出现的频率,用 r 表示词的等级序号,则有:fr = c (c 为常数 ) 应用词频分布规律及其参数,可以预测关键词的数量,计算各词汇的重要程度, 对于文献标引与词汇控制、词表的编制、文献信息检索等方面都具有重要的应用价值。
四、齐普夫定律
齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。若用f表示频次,r表示等级序号,则有fr=C(C为常数)。人们称该式为齐普夫定律。
五、普赖斯指数
1971年,美国科学学家D. 普赖斯提出了一个衡量各个知识领域文献老化的数量指标,即后人所称的“普赖斯指数”。就是在某一知识领域内,把对年限不超过五年的文献的引文数量与引文总量之比当作指数,用以量度文献的老化速度和程度。其计算公式如下:
P(普赖斯指数)=被引文献数量(小于或等于5年)×100%/被引文献总量。
六、文献老化规律
科技文献随着其"年龄"的增长,其内容日益变得陈旧过时,失去了作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利用的过程。科学文献老化既是一种客观的社会现象,又是一个复杂的动态过程。
第三部分 发展
- 网络信息计量学
- 计算机辅助信息计量分析法
- 计算机辅助信息计量分析法应用
- 信息计量学学科扩展
|