首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web新闻热点信息的自动发现及展示

摘要第1-6页
Abstract第6-8页
目录第8-10页
第一章 绪论第10-16页
   ·研究背景及意义第10-11页
   ·国内外研究现状第11-14页
     ·话题的检测与跟踪研究现状第11-13页
     ·关键词自动抽取研究现状第13-14页
   ·本文的研究内容第14页
   ·论文的组织结构第14-16页
第二章 相关理论和技术第16-25页
   ·PAT-Tree 技术第16-18页
   ·网页正文抽取技术第18-20页
   ·文本相似度计算方法第20-21页
   ·文本聚类第21-24页
     ·文本聚类概述第21页
     ·常用静态聚类算法第21-23页
     ·常用动态聚类算法第23-24页
   ·本章小结第24-25页
第三章 Web 页面采集与文本预处理第25-36页
   ·网络爬虫设计与实现第25-28页
     ·真实站点目录层次结构抽取第25-27页
     ·网页分类抓取实现第27-28页
   ·网页正文抽取第28-30页
   ·文本预处理第30-34页
     ·中文分词第31-32页
     ·停用词处理第32页
     ·特征词抽取及权重计算第32-33页
     ·稀疏向量压缩存储及相似度计算第33-34页
   ·本章小结第34-36页
第四章 热点信息发现第36-54页
   ·热点信息发现功能划分第36页
   ·热点词语发现第36-48页
     ·热点命名实体抽取第37-40页
     ·热点非实体串识别第40-48页
   ·热点话题发现第48-53页
     ·热点话题定义第48页
     ·话题检测与跟踪的设计与实现第48-51页
     ·话题的热度分析第51-52页
     ·话题发现与跟踪的类图第52-53页
   ·本章小结第53-54页
第五章 热点信息分析及展示第54-64页
   ·热点话题的分析及展示第54-61页
     ·话题的标题抽取及展示第54-59页
     ·话题的趋势图分析及展示第59-60页
     ·话题的信息岛图分析及展示第60-61页
   ·热点词语的分析及展示第61-63页
   ·本章小结第63-64页
结论第64-65页
参考文献第65-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:基于Lucene的XML索引与检索
下一篇:基于Artifact的业务流程建模与分析