首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于互联网的话题分类及敏感话题发现技术研究与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-13页
   ·课题的背景与意义第9-10页
   ·话题发现技术的现状及未来第10-11页
   ·课题研究的主要工作及内容第11-12页
   ·本论文的论述结构第12-13页
第二章 本论文涉及基础知识及技术介绍第13-31页
   ·话题爬虫介绍第13-19页
     ·什么是话题爬虫第13-14页
     ·话题爬虫搜索策略第14-15页
     ·页面去重算法布隆过滤器第15-19页
   ·全文检索引擎Lucene第19-24页
     ·什么是Lucene第20-21页
     ·Lucene 系统结构分析第21-24页
   ·WEB 文本挖掘技术第24-30页
     ·WEB 文本挖掘的含义第24页
     ·WEB 文本挖掘的方法第24-26页
     ·WEB 文本挖掘中算法介绍第26-30页
       ·PageRank 算法第26-28页
       ·文本分类算法介绍第28-30页
   ·本章小结第30-31页
第三章 系统整体框架设计第31-39页
   ·话题发现系统所面临重点与难点第31-32页
     ·重点研究课题第31页
     ·难点问题第31-32页
     ·相关解决方法第32页
   ·解析具体框架第32-38页
     ·话题发现与爬取框架第34-35页
     ·话题索引与分类框架第35-36页
     ·话题查询与推送框架第36-38页
   ·本章小结第38-39页
第四章系统详细设计与代码实现第39-63页
   ·话题爬取模块设计与实现第39-51页
     ·URL 地址整理与过滤第39-42页
     ·实质爬取设计与实现第42-49页
       ·建立连接,发送请求,接受数据第42-44页
       ·链接提取及网页分析第44-46页
       ·去重模块设计与实现第46-49页
     ·爬取模块性能与效率讨论第49-51页
   ·话题索引与分类模块设计第51-60页
     ·话题索引建立设计第54-58页
     ·话题分类模块设计第58-60页
   ·话题查询与推送模块第60-62页
     ·话题查询模块设计第60-61页
     ·结果排序模块设计第61页
     ·推送模块设计第61-62页
   ·本章小结第62-63页
第五章系统测试第63-67页
   ·测试环境第63页
   ·测试流程第63页
   ·测试结果第63-66页
   ·本章小结第66-67页
第六章总结与展望第67-68页
   ·本论文工作总结第67页
   ·今后展望第67-68页
致谢第68-69页
参考文献第69-71页
攻硕期间取得的研究成果第71-72页

论文共72页,点击 下载论文
上一篇:面向数字校园的异构数据整合的关键技术研究
下一篇:基于语义的P2P搜索研究与仿真实现