首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

质检舆情监控系统中信息检索的研究

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-13页
   ·研究背景第10页
   ·研究内容第10-11页
   ·研究意义第11-12页
   ·论文组织结构第12-13页
第二章 相关技术第13-25页
   ·垂直搜索技术第13-14页
   ·网络爬虫第14-16页
     ·网络爬虫常见问题第15页
     ·网络爬虫研究现状第15-16页
   ·Web信息抽取第16-18页
     ·DOM文档对象模型第17页
     ·SAX分析方法第17-18页
     ·HTMLParser第18页
   ·中文分词第18-20页
     ·基于字符串匹配的分词法第18-19页
     ·基于语义的分词法第19页
     ·人工智能法第19-20页
     ·ICTCLAS第20页
   ·文本相似度第20-21页
   ·文本聚类第21-22页
   ·信息检索第22-24页
     ·全文检索第22-23页
     ·倒排索引第23-24页
   ·本章小结第24-25页
第三章 信息检索系统设计第25-36页
   ·信息检索系统需求分析第25-26页
     ·系统的功能性需求第25-26页
     ·系统的非功能性需求第26页
   ·系统架构设计第26-29页
     ·质检舆情系统总体架构第26-28页
     ·检索系统架构第28-29页
   ·主要功能模块第29-31页
     ·文本相似度计算第29页
     ·网页去重第29-30页
     ·聚类优化第30页
     ·信息检索第30-31页
     ·统计报表第31页
   ·数据库设计第31-35页
     ·数据库整体设计第31-32页
     ·数据表设计第32-35页
   ·本章小结第35-36页
第四章 信息检索的优化处理第36-57页
   ·文本相似度计算第36-42页
     ·向量空间模型第36-37页
     ·相似度的特征项选择第37-38页
     ·权重第38-39页
     ·计算流程第39-42页
   ·网页去重第42-47页
     ·完全重复网页去重第42-45页
     ·部分重复网页去重第45-47页
   ·聚类优化第47-55页
     ·基于关键词关联的文本聚类第47-49页
     ·插值文本相似度第49-52页
     ·实验结果分析第52-55页
   ·本章小结第55-57页
第五章 信息检索接口的设计与实现第57-72页
   ·信息检索第57-67页
     ·初级检索第58-61页
     ·标准检索第61-66页
     ·高级检索第66-67页
   ·统计报表第67-71页
     ·按网站统计第67-68页
     ·按关键词统计第68-70页
     ·按时间统计第70-71页
   ·本章小结第71-72页
第六章 系统测试第72-77页
   ·系统测试第72-75页
     ·测试环境第72页
     ·测试用例设计第72-75页
   ·测试结果分析第75-76页
   ·本章小结第76-77页
第七章 总结与展望第77-78页
   ·总结第77页
   ·展望第77-78页
参考文献第78-81页
致谢第81-82页
攻读学位期间的研究成果第82页
学术论文第82页

论文共82页,点击 下载论文
上一篇:质检总局舆情监控系统中信息抽取的研究
下一篇:互联网舆情监控系统中聚焦爬虫的设计与实现