首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

话题检测与跟踪系统的构建

摘要第1-6页
ABSTRACT第6-11页
第一章 序论第11-19页
   ·研究背景及其意义第11-12页
   ·话题检测与跟踪简介第12-16页
     ·TDT的概念第12-13页
     ·TDT的发展历程第13-14页
     ·TDT的任务第14-16页
   ·系统框架第16-17页
   ·论文结构第17-19页
第二章 信息获取第19-25页
   ·RSS简介第19-21页
     ·RSS概念及其规范第19-20页
     ·RSS新闻信息获取第20-21页
   ·网页去噪声第21-24页
     ·网页去噪声的定义第21页
     ·网页去噪声相关研究第21-22页
     ·改进的网页去噪声算法第22-24页
   ·本章总结第24-25页
第三章 信息预处理与特征提取第25-36页
   ·预处理模块第25页
   ·文本表示第25-27页
     ·语言模型第26页
     ·VSM模型第26-27页
   ·权重计算第27-30页
     ·TF-IDF第27-28页
     ·增量的TF-IDF第28-29页
     ·TF-IDF其他变体算法第29页
     ·信息熵第29-30页
     ·布尔权重第30页
   ·特征选择第30-33页
     ·特征选择第30-31页
     ·文档频率第31页
     ·信息增益第31页
     ·互信息第31-32页
     ·开方检验第32-33页
   ·隐含语义检索第33-35页
     ·隐含语义的概念第33-34页
     ·奇异值分解第34页
     ·特征选择与LSI第34-35页
   ·本章总结第35-36页
第四章 话题检测与跟踪技术第36-50页
   ·话题检测任务第36-38页
     ·新事件检测第36-37页
     ·在线话题检测第37页
     ·事件回顾检测第37-38页
     ·层次话题检测第38页
   ·话题跟踪任务第38-40页
     ·传统话题跟踪第39页
     ·自适应话题跟踪第39-40页
   ·话题检测的相关技术第40-42页
     ·SS策略第41页
     ·SC策略第41-42页
     ·SCS策略第42页
   ·话题跟踪的相关技术第42-47页
     ·Rocchio第42-43页
     ·朴素贝叶斯第43-45页
     ·K邻近第45-46页
     ·支持向量机第46页
     ·决策树第46-47页
     ·神经网络第47页
   ·地名和时间信息第47-49页
     ·时间信息的应用第48页
     ·地点信息的应用第48-49页
   ·本章总结第49-50页
第五章 基于KNN的话题检测与跟踪系统第50-56页
   ·KNN简介第50-51页
     ·KNN在话题检测与跟踪的应用第50-51页
     ·KNN原理第51页
   ·KNN改进方案第51-53页
     ·RWKNN第52-53页
     ·特征映射第53页
   ·KNN及其在改进算法在TDT中的应用第53-55页
     ·归一化第54页
     ·相似度的计算第54-55页
   ·本章总结第55-56页
第六章 话题检测与跟踪系统测试第56-60页
   ·测试设计第56-58页
     ·实验语料第56页
     ·实验环境第56页
     ·实验设计第56-57页
     ·评测标准第57-58页
   ·测试结果及其分析第58-59页
   ·本章总结第59-60页
第七章 总结与展望第60-62页
   ·总结第60-61页
   ·展望第61-62页
参考文献第62-66页
致谢第66-67页
作者攻读学位期间发表的学术论文目录第67页

论文共67页,点击 下载论文
上一篇:嵌入式平台下可信计算协议栈的设计与实现
下一篇:信息系统安全等级符合性检验系统的设计与实现