您好、欢迎来到现金彩票网!
当前位置:21点 > 自动标引 >

书后主题索引的自动编制初探

发布时间:2019-06-27 05:49 来源:未知 编辑:admin

  书后主题索引的自动编制初探_文化/宗教_人文社科_专业资料。针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的书后主题索引自动编制方案,即将图书章节细化后利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨

  维普资讯 1 0 主里室!! ! 0 ! n iy f d e) f a e I e r to n x s 26 0 年第3 V1 .o ) 0 期(o4N. . 3 书后 主题 索 引 的 自动 编 制初 探 潘雪莲 钱丹雅 侯汉清 ( 南京农业大学信息管理 系 2 09 ) 10 5 摘 一 要 针对现有索引软件一般只能进行 字面标 引而不能实现概念标 引的不足 , 出了 提 个基 于概念标引的书后 主题 索引 自 动编制方案 , 即将 图书章 节细化后 利用基 于单篇文献的 自动标 引 系统进行 图书主题 标 引。通 过三 种标 引 系统对 实验语 料 的标 引结果 统计 来选择 标 引 系统; 其次通过对篇章结构分析 , 出基于标题符号 的标引源 自动识别方案 , 提 同时给各标引源 设定权重 , 出主题词标引流程 ; 提 最后还探讨 了标 引单元确定以及 索引地址设计。实验表 明, 基 于 N— rm方 法的 书后 主题 索 引的 自动 编 制方 法是 可行 的 。 ga 关 键词 书后 索引 主题 索 引 自动 标 引 N— rm 方法 ga 1 引 言 等 , 中很重要 的一个原 因就是技术 不成熟 , 其 缺乏 完善的索引软件 , 形成 书后索 引编制难 、 书后主题索 引编制难上加难的局面 。 12 目前主题 索引编制存在 的问题 . 1 1 国内书后索引的编制现状 . 书后索 引又称专著索 引、 卷末索引 , 出版物 中 是 学术参考资料 的重要组成部分 。主题索 引又是书后 索 引的主体。主题索 引是最完全 、 最实用 , 因而也是 最应 该 提 倡 的。美 国学 者 H _宾 尼 ( iny 有 过 Bn e ) “ 价值 之书籍而无索 引, 有 则其 为用 , 消失 一半 。 的 ” 精辟论述 。侯汉清 曾说 : 缺少书后索引的 图书实 际 “ 上是不完整 的 。 ¨ 很 多学 者早 在几 十 年前 就 开始 ” 呼 吁普及 书后索 引, 国 内书后索 引编 制现状 并没 但 早在 19 9 2年 , 国内已经有 了 Mar 、 idx I. ce Cne 、 x n d x d I d x r童 As itn 、 n e i、 ND X、 N > e Ai2、 n e e 、 s a t I d x t I EX s I Sr M ̄ 、n otD S Ncn e、 Idx等 1 ot c I >sr O 、 I dx wn e / / i 0种 较 稳定和较流行 的专用微 机辅 助标 引软件 。此 外 , 还 有 Wo e etM coo Wod等含有索引编辑功能 r rc、 irsf r dP f t 的文字处理软件 。由北京长城云天科技公司研制 J 的“ 引之 星 ” 国 内较 为完 善 的编 制书 刊索引 和 索 是 目录的专业 软件 , 已升级 到 20版本 。这 些索 引 现 . 软件都需要人工辅 助标 引 , 但这 些软件 的出现 已大 大节约 了编 制索 引的成本 与时间。 机编索 引技术 主要包 括标 引与 款 目生 成 、 辑 编 有 随着 时代进步 、 技术发展 而改善。 19 9 4年 , 纪晓萍 对 国内学者 自著书 书后索 引 编 制情 况进行调查 统计 , 有书后 索引 的 图书 占所 编 查 图书总数 的 12 .%。20 04年 , 柏康 对 国 内学 周 者 自著 书 编 制 书 后 索 引 情 况 进 行 调 查 , 例 为 比 2 3 % 。此外 , .9 两位都 还发 现在 这为 数不 多 的书后 索 引 中 , 题 索 引 更 是 微 乎 其 微 , 例 分 别 为 主 比 8 7 、0 , . % 2 % 编制书后 主题 索 引的 图书 可谓 凤毛麟 整理与索引生成两大部分 , 中款 目生成 、 辑整理 其 编 与索引生成 的 自动化技 术 已基 本成 熟 , 标引 自动 但 化技术 实现仍 然有难 度 , 引软 件 目前仍 然停 留在 索 自动抽取 关 键词 的水 平 。笔者 曾用 Mi sf Wo c o r o r t d 角。两 次调查 时间相 隔十年 , 然而数据相 差甚微 , 在 一 定程 度上说明了中文图书书后索引缺失是普遍 而 书后索引特别是主题索引对服务读者 的重 要作 的索引软件编制 < 文献 分类 法 主题法 导论) 书 的 一 人名索 引和主题 索引 , 人名索 引准确率 差强 人意 , 但 主题索引质量却很差 , 管关键 词在 该处是 具体 论 不 述还捎带提及 , 都无一 遗漏 地标 引 出来 。有 些词 出 现频率很高 , “ 如 分类标 引 ” 这个 词在整本 书 中出现 持续存 在的。 用与国内图书书后索 引的严 重 缺失形成 鲜 明对 比, 原因有很多 , 例如 , 文化 习惯 的 因素 、 传统 学术行 为 的规范问题 、 市场经 济 的发 展 、 代技 术 的 发展 等 现 的频率 为 16 , i o fW r 索引软件标 引出 5 2 次 M c st o r o d 3 维普资讯 潘雪莲 钱丹雅 侯汉清 :书后主题 索引的 自 动编制初探 次 。据 人工判 断识 别 , 只有 8 是对该 主题 的具 体 处 论述 , 由此可见索 引词 冗余 度之大 。正如 张琪玉 所 指 出的“ 图书索引要 求详 细而有选 择地 并相 当专 指 地标引 图书 的局部 主题 和主题 因素 , 但又 不允许 像 全文检索那样用所有关键词无遗漏

http://mervynsons.com/zidongbiaoyin/166.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有