基于粒子群优化算法的中文全文检索系统研究与开发
摘要 | 第1-4页 |
Abstract | 第4-8页 |
1 绪论 | 第8-14页 |
·研究背景 | 第8-9页 |
·国内外研究现状 | 第9-12页 |
·全文检索的发展现状 | 第9-10页 |
·汉语自动分词的研究现状 | 第10-12页 |
·研究意义和文章结构 | 第12-14页 |
2 中文全文检索技术 | 第14-24页 |
·组织索引技术 | 第14-16页 |
·全文检索模型 | 第16-17页 |
·倒排表的组织 | 第17-19页 |
·中英文全文检索的区别 | 第17页 |
·基于中文分词的倒排表 | 第17-19页 |
·中文自动分词技术 | 第19-22页 |
·基于字符串匹配的分词方法 | 第19-20页 |
·基于理解的分词方法 | 第20页 |
·基于统计的分词方法 | 第20-22页 |
·小结 | 第22-24页 |
3 理论基础 | 第24-31页 |
·自动分词语言模型 | 第24-27页 |
·N-gram模型 | 第24-27页 |
·粒子群优化算法 | 第27-30页 |
·基本粒子群算法 | 第28-29页 |
·改进的粒子群算法 | 第29-30页 |
·粒子群优化算法在本文中的可行性 | 第30-31页 |
4 基于粒子群算法的中文分词算法 | 第31-55页 |
·基本思想 | 第31-35页 |
·基于统计的语言模型 | 第31-32页 |
·本文中“中文分词”的处理流程 | 第32-35页 |
·统计分词模型的建立与求解—基于粒子群算法 | 第35-45页 |
·基本思想 | 第35页 |
·词图模型 | 第35页 |
·统计模型的建立 | 第35-37页 |
·求解统计模型(最小费用路径)的粒子群算法 | 第37-45页 |
·分词结果分析 | 第45-53页 |
·完整的求解过程 | 第45-47页 |
·结果比较 | 第47-53页 |
·算法优化 | 第53-55页 |
5 系统设计 | 第55-73页 |
·相关 API包 | 第55-61页 |
·Lucene工具包 | 第55-60页 |
·jxl工具包 | 第60-61页 |
·系统总体设计 | 第61-62页 |
·系统实现过程及关键问题解决 | 第62-72页 |
·平台及开发环境 | 第62-63页 |
·数据加工模块的实现 | 第63-69页 |
·创建数据索引 | 第69-70页 |
·检索和结果处理 | 第70-72页 |
·系统特点 | 第72-73页 |
(1) 系统结构便于扩展 | 第72页 |
(2) 系统便于移植 | 第72页 |
(3) 检索结果准确、高效 | 第72-73页 |
6 总结与展望 | 第73-74页 |
附录1 本文算法对标准评测试题的分词结果 | 第74-79页 |
附录2 本系统界面及运行效果图 | 第79-81页 |
参考文献 | 第81-84页 |
作者在攻读硕士学位期间的相关工作 | 第84-86页 |
致谢 | 第86页 |