摘要 | 第1-12页 |
ABSTRACT | 第12-14页 |
第一章 计算机检索的发展现状和研究动态 | 第14-19页 |
·计算机检索的发展历史 | 第14-15页 |
·计算机检索的途径和模式 | 第15-16页 |
·检索文献外部特征 | 第15页 |
·检索文献内容 | 第15-16页 |
·基于标引的检索系统 | 第15页 |
·全文检索系统 | 第15-16页 |
·目前国内有代表性的全文检索系统 | 第16-17页 |
·全文检索系统的优势和中文全文检索存在的难点 | 第17-18页 |
·全文检索系统的优势 | 第17页 |
·中文全文检索存在的难点 | 第17-18页 |
·本系统要解决的问题 | 第18-19页 |
第二章 词性标注和基于文摘检索的研究 | 第19-27页 |
·对英文的词性标注的研究 | 第19-21页 |
·一些英语词性自动标注系统介绍 | 第19-21页 |
·TDAP项目 | 第20页 |
·Brown语料库和TAGGIT系统 | 第20页 |
·LOB语料库和CLAWS系统、PARTS系统 | 第20-21页 |
·Brill系统 | 第21页 |
·对汉语的词性标注的研究 | 第21-23页 |
·汉语词性自动标注系统介绍 | 第22-23页 |
·人民日报标注语料库 | 第22页 |
·马氏族模型 | 第22页 |
·基于搭配模式的汉语词性标注方法 | 第22-23页 |
·基于规则和概率统计相结合的词性标注系统 | 第23页 |
·基于特征的汉语词性标注模型 | 第23页 |
·学者对词性标注和检索性能之间关系的观点 | 第23-24页 |
·文摘检索的必要性和可行性 | 第24-26页 |
·文摘检索的必要性 | 第24-25页 |
·文摘检索的可行性 | 第25-26页 |
·自然语言提问 | 第26-27页 |
第三章 基于内容检索系统的实现原理 | 第27-41页 |
·基于内容检索的含义 | 第27-28页 |
·预处理过程 | 第28-31页 |
·切词 | 第28-29页 |
·ICTCLAS系统介绍 | 第28-29页 |
·采用词性标记的目的 | 第29页 |
·存入数据库并进行处理 | 第29-31页 |
·对于含有换页符、回车换行符和空格的词的处理 | 第29-30页 |
·对于表中词为空或词无意义的记录处理 | 第30页 |
·对于表中词性为空及词性无意义的记录的处理 | 第30页 |
·对于标点符号、停用词以及其他无检索意义的记录的处理 | 第30-31页 |
·计算语词权值 | 第31-36页 |
·词频统计 | 第31页 |
·词频加权 | 第31-35页 |
·词频加权实验设计 | 第32-33页 |
·词频加权实验过程 | 第33-34页 |
·词频加权实验结果 | 第34-35页 |
·词位置加权 | 第35-36页 |
·计算句子权值 | 第36-38页 |
·句中语词权值求和 | 第36页 |
·句子在文章中的位置 | 第36页 |
·指示性短语 | 第36-37页 |
·线索词 | 第37页 |
·句法结构 | 第37页 |
·句子长度 | 第37页 |
·段落包含的不同的关键词数 | 第37-38页 |
·句子相关性排序 | 第38页 |
·检索过程 | 第38-39页 |
·扩检 | 第39-41页 |
第四章 基于内容信息检索系统的设计与实现 | 第41-50页 |
·基于内容的信息检索系统的设计 | 第41-43页 |
·预处理模块 | 第41-42页 |
·语词权值计算模块 | 第42页 |
·句子权值计算模块 | 第42页 |
·句子排序模块 | 第42页 |
·检索模块 | 第42-43页 |
·扩检模块 | 第43页 |
·基于内容的信息检索系统介绍 | 第43-47页 |
·主窗口菜单和工具栏介绍 | 第44-46页 |
·文件菜单 | 第44页 |
·编辑菜单 | 第44页 |
·检索菜单 | 第44页 |
·原文菜单 | 第44-45页 |
·帮助菜单 | 第45页 |
·工具栏 | 第45-46页 |
·副窗口菜单和工具栏介绍 | 第46-47页 |
·文件菜单 | 第46页 |
·编辑菜单 | 第46页 |
·全文菜单 | 第46页 |
·工具栏 | 第46-47页 |
·基于内容的信息检索系统的使用说明 | 第47-50页 |
·语句检索 | 第47-48页 |
·语词检索 | 第48-50页 |
第五章 基于内容信息检索系统的测评 | 第50-65页 |
·常用信息检索系统测评方法 | 第50-51页 |
·查全率和查准率指标 | 第50-51页 |
·查全率 | 第50-51页 |
·查准率 | 第51页 |
·查准率直方图 | 第51页 |
·概括表统计 | 第51页 |
·系统测评 | 第51-65页 |
·测试主题是否在题名中出现 | 第52-57页 |
·检索课题1——“网络流量控制” | 第52页 |
·检索课题2——“网络路由算法” | 第52-53页 |
·检索课题3——“面向对象的程序设计” | 第53页 |
·检索课题4——“加权算法的研究” | 第53页 |
·检索课题5——“人脸识别算法” | 第53-54页 |
·检索课题6——“智能Agent” | 第54页 |
·检索课题7——“网络安全协议” | 第54页 |
·检索课题8——“相似度分析” | 第54-55页 |
·检索课题9——“密钥管理” | 第55页 |
·检索课题10——“基于图像的检索” | 第55页 |
·十个检索课题结果统计 | 第55-57页 |
·测试主题是否在关键词中出现 | 第57-60页 |
·检索课题1——“网络流量控制” | 第57页 |
·检索课题2——“网络路由算法” | 第57页 |
·检索课题3——“面向对象的程序设计” | 第57-58页 |
·检索课题4——“加权算法的研究” | 第58页 |
·检索课题5——“人脸识别算法” | 第58页 |
·检索课题6——“智能Agent” | 第58页 |
·检索课题7——“网络安全协议” | 第58页 |
·检索课题8——“相似度分析” | 第58-59页 |
·检索课题9——“密钥管理” | 第59页 |
·检索课题10-——“基于图像的检索” | 第59页 |
·十个检索课题结果统计 | 第59-60页 |
·对不带词性检索与带有词性检索的测评 | 第60-65页 |
·检索课题1——数据挖掘 | 第60-61页 |
·检索课题2——图像检索 | 第61-62页 |
·检索课题3——人脸识别 | 第62-63页 |
·对词性检索测试的小结 | 第63-65页 |
第六章 总结与展望 | 第65-69页 |
·系统主要成果 | 第65-67页 |
·实现了词性匹配检索 | 第65页 |
·实现了基于重要句群的检索 | 第65-66页 |
·具有扩检功能 | 第66页 |
·具有部分数据挖掘功能 | 第66页 |
·支持自然语句提问检索 | 第66-67页 |
·本实验系统存在的问题 | 第67-68页 |
·系统所包含的文献量偏少,不足以达到实用水平 | 第67页 |
·对于自然语句提问的研究不够充分 | 第67-68页 |
·后续研究工作 | 第68-69页 |
·不断改进现有理论,提出更好的理论模型 | 第68页 |
·不断补充文献数量,使系统能够实用化 | 第68页 |
·总结更多的提问模式,实现完全自由的自然语言提问 | 第68-69页 |
参考文献 | 第69-72页 |
附录1 汉语文本词性标注标记集(北大版) | 第72-73页 |
致谢 | 第73页 |