首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于中文信息检索的文本预处理研究

中文摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-14页
     ·研究背景及意义第9页
     ·信息检索第9-11页
     ·信息检索国内外研究状况第11-13页
     ·本文的研究内容和组织安排第13-14页
第二章 文本预处理的相关技术第14-27页
     ·文本表示第14-17页
     ·分词第17-22页
       ·机械分词法第17-21页
         ·最大匹配算法第17-18页
         ·邻近匹配算法第18-19页
         ·最短路径匹配算法第19-20页
         ·基于统计的最短路径分词算法第20-21页
       ·非机械分词法第21页
       ·分词算法性能评价第21-22页
     ·词性标注第22-24页
       ·基于规则的方法第22-23页
       ·基于统计的方法第23页
       ·混合方法第23-24页
     ·停用词过滤第24页
     ·标引项的选择第24-27页
第三章 基于信息检索的文本预处理的算法设计第27-37页
     ·本文要解决的问题第27页
     ·本文采用的分词和词性标注方法第27-32页
       ·分词和词性标注一体化第27-30页
       ·重叠词的处理第30-31页
       ·未登陆词的识别第31-32页
     ·本文采用的标引词选择方法第32-37页
       ·标引词选择算法的提出第33-34页
       ·一个实例第34-37页
第四章 系统设计与实现第37-63页
     ·系统流程第37-38页
     ·词典设计第38-39页
       ·基本词典第38-39页
       ·其它词典第39页
     ·从语料中获取参数第39-41页
     ·系统的详细设计第41-63页
       ·断句模块第41-42页
       ·分词和词性标注模块第42-46页
       ·重叠词识别模块第46-50页
       ·未登录词处理模块第50-54页
       ·标引词的选择模块第54-60页
       ·实验结果第60-63页
第五章 总结第63-65页
致谢第65-66页
参考文献第66-69页
攻硕期间取得的研究成果第69页

论文共69页,点击 下载论文
上一篇:群体动画实时渲染技术的研究
下一篇:基于遗传算法的软件测试资源分配问题研究