首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

应用于文本搜索引擎的聚类算法研究

摘要第1-7页
ABSTRACT第7-11页
1 绪论第11-14页
   ·本文研究背景和意义第11-12页
   ·主要工作内容第12-13页
   ·论文的组织结构第13-14页
2 相关知识与技术第14-29页
   ·搜索引擎第14-20页
     ·搜索引擎分类第14-15页
     ·搜索引擎的工作原理第15-17页
     ·搜索引擎的结果表示方法第17-20页
   ·文本聚类算法第20-24页
     ·文本聚类的特殊问题第20-21页
     ·常见的文本聚类算法第21-24页
     ·中文文本聚类面临的挑战第24页
   ·《知网》电子资源第24-27页
     ·《知网》的结构第25页
     ·《知网》中的关系第25-27页
     ·《知网》的记录样式第27页
   ·本章小结第27-29页
3 CCSE 系统总体设计第29-37页
   ·开发环境第29页
   ·系统功能模块第29-32页
   ·系统体系结构第32-33页
   ·主要技术应用第33-36页
     ·网页解析第33页
     ·中英文分词第33-34页
     ·关键技术第34-35页
     ·系统时序图第35-36页
   ·本章小结第36-37页
4 关键技术第37-49页
   ·未登录词处理第37-43页
     ·未登录词简介第37-38页
     ·义原相似度计算第38-39页
     ·概念词语的相似度计算第39-40页
     ·未登录概念词语的相似度计算第40-43页
   ·短语相似度算法第43-45页
     ·形态相似度计算第43页
     ·语义词序相似度计算第43-44页
     ·短语相似度计算第44-45页
   ·文本聚类及聚类标签生成第45-47页
     ·构建后缀树第45页
     ·选择候选标签第45-46页
     ·后续处理第46-47页
   ·本章小结第47-49页
5 测试与验证第49-62页
   ·单元测试第49-55页
     ·预处理单元第49页
     ·TF-IDF 计算单元第49-50页
     ·语义相似度计算单元第50-55页
   ·聚类系统测试第55-61页
     ·测试结果比较第56-60页
     ·时间复杂度分析第60-61页
   ·本章小结第61-62页
6 总结与展望第62-64页
   ·总结第62页
   ·未来展望第62-64页
参考文献第64-66页
致谢第66-67页
攻读学位期间发表的学术论文目录第67页

论文共67页,点击 下载论文
上一篇:东航维修管理信息系统的设计与实现
下一篇:设计模式在胖客户端软件中的应用研究