首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

话题检测与跟踪算法的研究

致谢第1-6页
摘要第6-7页
ABSTRACT第7-10页
1 引言第10-20页
   ·课题研究背景第10页
   ·话题检测、话题跟踪的发展与现状第10-12页
   ·TDT研究任务及主要技术第12-17页
     ·话题检测与跟踪的任务第12-16页
     ·实现话题检测的主要技术第16页
     ·实现话题跟踪的主要技术第16-17页
   ·TDT的研究前景第17-18页
   ·本文主要工作及组织安排第18-20页
     ·本文主要研究内容第18页
     ·全文组织安排第18-20页
2 话题检测与跟踪的常用技术第20-32页
   ·常用的文本聚类方法第20-23页
     ·划分方法第20-21页
     ·层次聚类方法第21-22页
     ·基于密度的方法第22页
     ·基于网格的方法第22-23页
     ·基于模型的方法第23页
   ·中英文文本预处理差异第23-24页
   ·新闻文本模型的表示第24-26页
     ·语言模型第25页
     ·向量空间模型第25-26页
   ·文本特征选择及特征权重计算方法第26-29页
     ·文本特征选择第26-28页
     ·特征权重计算第28-29页
   ·文本相似度的计算方法第29-30页
     ·语言模型的相似度计算第29页
     ·向量空间模型的相似度计算第29-30页
   ·类簇的相似度计算方法第30-31页
   ·本章小结第31-32页
3 基于时间信息的自适应话题跟踪算法的研究第32-49页
   ·传统话题跟踪的算法第32-37页
     ·传统话题跟踪的思想与处理流程第32页
     ·话题跟踪的文本预处理模块第32-34页
     ·构建话题模型模块第34-35页
     ·相似度计算及阈值比较模块第35-36页
     ·算法性能评价模块第36-37页
   ·自适应的话题跟踪第37-38页
   ·时间信息在话题跟踪中的应用第38-41页
   ·话题跟踪的测试语料第41-42页
   ·效果评价指标第42-43页
   ·实验结果与分析第43-48页
   ·本章小结第48-49页
4 基于层次聚类的话题检测算法的研究第49-60页
   ·传统的话题检测中的层次聚类算法第49-50页
     ·传统层次聚类的基本思想第49页
     ·传统话题检测中层次聚类算法的流程第49-50页
   ·话题检测算法的改进策略第50-52页
     ·话题类簇向量的特征更新第50-51页
     ·话题检测过程中新闻报道合并的规则第51-52页
   ·改进后的话题检测算法第52-57页
     ·构建报道向量并建立矩阵第52-54页
     ·话题类簇代表向量的更新模块第54页
     ·话题检测中的报道合并第54-57页
   ·实验结果与分析第57-59页
   ·本章小结第59-60页
5 结论第60-62页
   ·研究工作总结第60页
   ·今后课题研究方向第60-62页
参考文献第62-66页
学位论文数据集第66页

论文共66页,点击 下载论文
上一篇:基于数据仓库的煤矿决策支持系统研究
下一篇:基于CNML的数字资源管理与应用平台的实现