首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文微博的热点话题发现

摘要第1-4页
Abstract第4-5页
目录第5-7页
第一章 绪论第7-16页
   ·研究背景与意义第7-8页
   ·国内外研究现状第8-10页
   ·目前存在的问题第10-14页
     ·中文分词问题第10-14页
     ·特征词提取第14页
     ·聚类算法第14页
   ·论文结构安排第14-16页
第二章 话题检测相关知识第16-24页
   ·话题检测任务第16-17页
     ·新事件检测任务第16-17页
     ·在线话题检测第17页
     ·事件回顾检测第17页
     ·层次话题检测第17页
   ·话题检测相关技术第17-19页
     ·报道-报道策略第18页
     ·报道-聚集策略第18-19页
     ·基于报道-聚集-报道策略第19页
   ·话题检测评价标准第19-20页
   ·聚类算法有效性评价标准第20-23页
     ·内部质量指标第20-21页
     ·外部质量指标第21-23页
   ·本章小结第23-24页
第三章 微博热点话题检测算法第24-33页
   ·微博热点话题检测算法流程图第24-25页
   ·预处理第25-26页
     ·过滤噪音数据第25-26页
     ·分词及去停用词第26页
   ·微博数据的文本表示第26-27页
   ·特征选择法第27-30页
     ·信息增益法第28-29页
     ·互信息法第29页
     ·x~2统计计量法第29-30页
     ·文档频率法第30页
   ·基于文档频率优化的特征提取法第30-31页
   ·隐含语义分析第31-32页
     ·隐含语义的概念第31页
     ·奇异值分解第31-32页
     ·特征选择与LSA第32页
   ·本章小结第32-33页
第四章 基于TF-IDF改进的词汇权重计算第33-41页
   ·布尔权重计算法第33页
   ·信息熵权重算法第33页
   ·TF-IDF权重计算法第33-35页
   ·微博数据上TF-IDF算法的不适用性分析第35页
   ·改进的词汇权重的计算第35-37页
   ·改进的词汇权重的计算方法的效果第37-40页
   ·小结第40-41页
第五章 微博聚类算法第41-48页
   ·中文文本聚类算法第41-43页
     ·基于层次的聚类方法第41-42页
     ·基于划分的聚类方法第42-43页
     ·基于密度的聚类方法第43页
   ·针对微博数据的聚类算法第43-46页
     ·图聚类概念第44页
     ·边权重的计算第44-45页
     ·边权重的归一化处理第45页
     ·两节点间的相似度计算第45页
     ·两节点关联度计算第45-46页
   ·多属性无向加权图聚类算法第46-47页
   ·事件关键词的提取第47页
   ·本章小结第47-48页
第六章 实验与结果分析第48-52页
   ·实验数据第48页
   ·评测标准第48-49页
   ·实验结果第49-51页
   ·对比试验第51页
   ·实验结果分析第51-52页
第七章 总结和展望第52-54页
   ·本文总结第52页
   ·未来工作展望第52-54页
致谢第54-55页
参考文献第55-59页
在读期间发表的学术论文第59页

论文共59页,点击 下载论文
上一篇:基于BTM的短文本聚类
下一篇:RoboCup中NAO红球识别追踪及自定位研究