首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

话题检测研究

致谢第1-6页
摘要第6-7页
ABSTRACT第7-11页
1 引言第11-15页
   ·研究背景第11-13页
     ·话题检测与跟踪第11-13页
     ·编码索引技术第13页
   ·本文研究内容及组织结构第13-15页
2 话题检测的相关技术第15-25页
   ·向量空间模型第15页
   ·TF-IDF计算第15-16页
   ·文档相似度计算第16-17页
   ·类簇相似度计算第17-18页
   ·文档聚类第18-21页
     ·层次聚类第18-19页
     ·简单聚类第19-20页
     ·最远样本中心聚类第20-21页
     ·K均值聚类第21页
   ·新事件检测第21-23页
   ·事件回顾检测第23-25页
3 常用索引相关技术综述第25-35页
   ·编码方法第25-26页
     ·顺序编码第25页
     ·二进制编码第25-26页
     ·Unicode编码第26页
     ·哈希编码第26页
   ·字符串哈希函数第26-28页
     ·折叠法第27页
     ·ELFHash函数第27页
     ·djb2哈希函数第27-28页
     ·RSHash函数第28页
     ·JSHash函数第28页
   ·索引技术第28-35页
     ·数组索引第29页
     ·链式索引第29页
     ·树型索引第29-32页
     ·哈希索引第32-35页
4 用于优化话题检测的索引算法设计第35-47页
   ·准动态数组索引第35-40页
     ·复合编码实现第35-36页
     ·主索引表设计第36-37页
     ·索引更新策略第37-39页
     ·索引合并策略第39-40页
     ·性能分析第40页
   ·哈希桶内链索引第40-43页
     ·复合编码修正第40页
     ·数据结构第40-41页
     ·检索方法第41-42页
     ·索引更新方法第42-43页
     ·性能分析第43页
   ·双链聚合哈希索引第43-47页
     ·数据结构第43-44页
     ·检索方法第44-45页
     ·索引更新第45-46页
     ·性能分析第46-47页
5 话题检测系统设计与实现第47-55页
   ·程序总体结构第47-48页
   ·类定义及功能第48-53页
     ·File List类第48页
     ·File类第48-49页
     ·TypeList类第49-50页
     ·News类第50页
     ·Topic类第50-51页
     ·TopicList类第51页
     ·Vectors类第51-52页
     ·Key类第52页
     ·Index类第52-53页
   ·无编码索引实现第53-55页
6 实验设计及结果第55-63页
   ·话题检测语料第55-57页
   ·索引内存占用第57-59页
   ·索引创建效率第59-60页
   ·索引检索效率第60-61页
   ·话题检测实际性能测试第61-63页
7 结论第63-64页
参考文献第64-67页
学位论文数据集第67页

论文共67页,点击 下载论文
上一篇:350km/h动车组牵引辅助系统的仿真分析与参数研究
下一篇:混合交通环境下交叉口自行车微观仿真系统的开发