首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Nutch搜索引擎的中文分词算法研究与实现

摘要第1-4页
Abstract第4-8页
1 绪论第8-16页
   ·课题背景第8页
   ·分词对搜索引擎的重要性第8-10页
   ·中文分词现状第10-11页
   ·中文分词的应用第11-12页
   ·Nutch 搜索引擎第12-15页
     ·Nutch 网络蜘蛛第12-14页
     ·Nutch 网络蜘蛛工作流程第14-15页
   ·论文结构第15-16页
2 中文分词概述第16-26页
   ·中文分词理论基础第16-17页
     ·中文分词概念第16页
     ·中文分词系统的评价标准第16-17页
   ·中文分词算法第17-23页
     ·基于字符串匹配的分词方法第17-21页
     ·基于统计的分词方法第21-22页
     ·基于理解的分词方法第22-23页
   ·中文分词的难点第23-25页
     ·分词规范问题第23-24页
     ·歧义识别第24页
     ·未登录词识别第24-25页
   ·小结第25-26页
3 中文分词的核心技术第26-37页
   ·中文分词流程第26页
   ·分词算法衡量标准第26页
   ·词典机制第26-27页
   ·分词算法优化第27-36页
     ·基于首字hash 的匹配算法第27-30页
     ·基于首字最长词条匹配算法第30-33页
     ·基于首字最长词条匹配算法的改进第33-36页
   ·小结第36-37页
4 中文分词在 Nutch 中的应用第37-44页
   ·Nutch 中文分词第37-39页
     ·Nutch 自带中文分词第37页
     ·Nutch 中添加中文分词插件第37-39页
   ·Nutch 搜索引擎搭建第39-41页
     ·开发软件介绍第39页
     ·Nutch 搭建流程第39-41页
   ·中文分词结果验证第41-43页
     ·luke 工具简介第42页
     ·分词结果验证第42-43页
   ·小结第43-44页
5 总结与展望第44-45页
   ·总结第44页
   ·展望第44-45页
致谢第45-46页
参考文献第46-48页
作者简介第48页

论文共48页,点击 下载论文
上一篇:内蒙古森林NPP多尺度观测空间信息系统研究
下一篇:面向智能信息检索技术的Web挖掘关键技术的研究