首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web新闻话题检测与追踪技术研究

表目录第1-8页
图目录第8-9页
摘要第9-10页
ABSTRACT第10-11页
第一章 引言第11-18页
   ·课题的来源和意义第11页
   ·基本概念第11-12页
     ·话题第11页
     ·事件第11-12页
     ·故事第12页
   ·话题检测与追踪的发展与现状第12-13页
   ·Web新闻话题检测与追踪系统框架第13-16页
     ·Web信息采集第14页
     ·Web信息抽取第14-15页
     ·话题检测技术第15页
     ·话题追踪技术第15-16页
   ·论文的主要贡献和结构安排第16-18页
第二章 Web信息采集第18-28页
   ·Web信息采集概述第18页
   ·Web信息采集的结构第18-21页
     ·URL处理器第19页
     ·网页采集器第19-20页
     ·网页去重检测器第20页
     ·URL提取器第20页
     ·标签信息提取器第20-21页
     ·数据库第21页
   ·Web信息采集的扩展第21-24页
     ·Robots协议第21-22页
     ·网页类型判断第22页
     ·新闻时间的提取第22-24页
   ·Web信息采集器的实现第24-26页
   ·实验结果及性能分析第26-27页
   ·本章小结第27-28页
第三章 基于向量空间模型的网页噪声净化第28-38页
   ·文本向量表示第28-31页
     ·特征项第29-30页
     ·特征项加权第30-31页
   ·网页噪声分析及其影响第31-32页
   ·基于向量空间模型的网页噪声净化第32-34页
     ·文档树第32-34页
     ·网页主题块提取第34页
     ·基于向量空间模型的网页噪声净化算法第34页
   ·实验结果及性能分析第34-37页
     ·实验环境第34-35页
     ·实验结果及性能分析第35-37页
   ·本章小结第37-38页
第四章 基于话题重心自适应的话题检测第38-48页
   ·话题检测概述第38-39页
   ·新闻话题的表示第39-40页
     ·特征项第39页
     ·特征项权重第39页
     ·特征维数约减第39页
     ·话题的表示第39-40页
   ·话题检测算法第40-43页
     ·增量式聚类算法第40-41页
     ·话题重心的修正第41-42页
     ·话题重心的组合第42-43页
     ·基于话题重心自适应的话题检测算法第43页
   ·实验结果及性能分析第43-47页
     ·实验数据第43-44页
     ·实验结果评测标准第44-45页
     ·实验结果及性能分析第45-47页
   ·本章小结第47-48页
第五章 一种改进的KNN话题追踪方法第48-58页
   ·话题追踪概述第48-49页
   ·话题追踪相关研究第49-51页
     ·马萨诸塞大学的方法第49-50页
     ·BBN公司的方法第50页
     ·卡内基梅隆大学的方法第50-51页
   ·一种改进的KNN话题追踪方法第51-56页
     ·文本分类中的特征选择第52-53页
     ·KNN话题追踪方法第53-54页
     ·算法的分析与改进第54-55页
     ·改进的KNN话题追踪方法第55-56页
   ·实验结果及性能分析第56-57页
     ·实验数据及测试方法第56页
     ·实验结果及性能分析第56-57页
   ·本章小结第57-58页
结束语第58-60页
 一、全文总结第58页
 二、展望第58-60页
参考文献第60-64页
作者简历 攻读硕士学位期间完成的主要工作第64-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:绵羊IgG2 Fc受体(Fcγ2R)基因克隆与表达
下一篇:姜黄素对人舌鳞癌Tca8113细胞抑制作用的实验研究