面向微博的新词发现和话题检测技术研究

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-14页
·研究背景和意义	第9-10页
·新词发现和话题检测研究现状	第10-12页
·新词发现研究现状	第10-11页
·话题检测研究现状	第11-12页
·本文研究内容和组织结构	第12-14页
·本文研究内容	第12-13页
·本文组织结构	第13-14页
第二章微博数据采集方法研究	第14-22页
·常用数据采集方法研究	第14-17页
·传统数据采集技术	第14-15页
·基于微博 API 的微博采集方法	第15-17页
·本文的数据采集方法	第17-22页
·微博数据采集面临的主要问题	第18页
·本文微博数据采集系统	第18-22页
第三章基于词内部结合度和边界自由度的新词发现	第22-33页
·词内部结合度和边界自由度的新词发现算法思想	第22-24页
·传统新词发现方法分析	第22页
·新词发现思路分析	第22-23页
·词内部结合度和边界自由度的新词发现总体框架	第23-24页
·面向结合度和自由度计算的关键技术分析	第24-30页
·微博预处理	第24-26页
·面向结合度和自由度计算的相关模型	第26-28页
·基于词内部结合度的二元组筛选	第28页
·基于词边界自由度的新词发现	第28-30页
·实验设计与结果分析	第30-33页
·COAE2014 评测	第31页
·对比实验	第31-33页
第四章基于 LDA 模型和多层聚类的微博话题检测	第33-48页
·聚类算法分析	第33-35页
·K-Means 聚类	第33-34页
·Single-Pass 聚类	第34页
·层次聚类	第34-35页
·基于 LDA 模型和多层聚类的微博话题检测	第35-41页
·LDA 模型和多层聚类微博话题检测总体框架	第35-36页
·基于 LDA 模型的微博文本建模	第36-38页
·微博短文本相似度计算	第38-40页
·改进的 Single-Pass 聚类	第40-41页
·凝聚式层次聚类	第41页
·关键词提取和话题热度分析	第41-45页
·关键词提取	第41-44页
·话题热度分析	第44-45页
·实验设计与结果分析	第45-48页
·评价指标	第45-46页
·多层聚类性能检测	第46-47页
·不同阈值对话题检测性能的影响	第47-48页
第五章微博新词发现和话题检测系统的设计与实现	第48-54页
·系统总框架设计	第48页
·系统各功能模块实现	第48-54页
·基础功能	第49-50页
·数据采集	第50-52页
·微博新词发现	第52-53页
·微博话题检测	第53-54页
第六章总结和展望	第54-57页
·本文工作总结	第54-55页
·研究展望	第55-57页
参考文献	第57-60页
个人简介及在校期间的科研成果	第60-61页
致谢	第61页