首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于词典的中文分词算法研究及其在Nutch系统中的应用

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-12页
   ·研究背景和研究意义第9-10页
   ·本文主要工作第10-11页
   ·本文的组织结构第11-12页
第2章 中文分词技术及 NUTCH 概述第12-26页
   ·中文分词技术第12-18页
     ·中文分词技术简介第12-15页
     ·中文分词中的难题第15-17页
     ·中文分词的应用第17-18页
   ·NUTCH第18-26页
     ·Nutch 工作流程第18-19页
     ·Nutch 基本原理分析第19-23页
     ·Nutch 的分词架构第23-26页
第3章 基于词典的中文分词算法研究第26-37页
   ·中文分词的一般过程第26页
   ·词典的组织结构第26-28页
     ·基于整词二分的分词词典机制第26-27页
     ·基于 TRIE 索引树的分词词典机制第27页
     ·基于逐字二分的分词词典机制第27-28页
   ·双字哈希索引分词词典第28-31页
     ·双字哈希词典结构第28-30页
     ·查询算法第30-31页
   ·基于词典的中文分词算法及实现第31-37页
     ·实现方法第31-34页
     ·测试第34-37页
第4章 中文分词算法在 NUTCH 中的实现第37-48页
   ·系统实现环境第37页
   ·Nutch 的安装和配置第37-41页
   ·实现 Nutch 中文分词的代码修改第41-44页
   ·中文分词算法的测试第44-48页
     ·抓取结果的分词测试第44-45页
     ·查询关键字的分词测试第45-46页
     ·搜索结果测试第46-48页
结论第48-50页
参考文献第50-52页
致谢第52页

论文共52页,点击 下载论文
上一篇:呼伦贝尔学院传媒学院学生自主管理系统的设计与实现
下一篇:财政局财务管理系统预算执行子系统的设计与实现