面向食药安全主题的突发话题检测技术研究

摘要	第5-6页
abstract	第6-7页
第一章绪论	第11-20页
1.1 论文研究背景及意义	第11-12页
1.2 国内外研究现状	第12-16页
1.2.1 话题的特征提取与表示	第12-13页
1.2.2 话题聚类	第13-14页
1.2.3 突发话题检测	第14-16页
1.2.4 发展态势	第16页
1.3 论文的主要研究内容	第16-18页
1.4 论文的创新点	第18页
1.5 论文的组织结构	第18-20页
第二章相关理论与技术	第20-32页
2.1 数据预处理	第20-24页
2.1.1 分词	第20-21页
2.1.2 命名实体识别	第21页
2.1.3 频繁模式发现算法	第21-24页
2.2 文本特征词提取与表示	第24-28页
2.2.1 特征提取TF-IDF算法	第25页
2.2.2 文本表示模型	第25-27页
2.2.3 文本相似度度量	第27-28页
2.3 话题检测技术	第28-31页
2.3.1 文本聚类算法	第29-30页
2.3.2 概率主题模型—LDA	第30页
2.3.3 社团划分算法	第30-31页
2.4 本章小结	第31-32页
第三章可变长文本的图结构模型	第32-42页
3.1 基于WORD2VEC的主题爬虫算法	第33-36页
3.2 话题关键词选取与特征提取	第36-39页
3.2.1 有意义串识别	第36-37页
3.2.2 话题关键词选取	第37-38页
3.2.3 特征提取	第38-39页
3.3 可变长文本的话题网络构建	第39-40页
3.4 本章小结	第40-42页
第四章话题聚类与突发话题检测	第42-51页
4.1 话题聚类	第42-44页
4.1.1 大规模网络社团发现算法——Blondel算法	第42-44页
4.1.2 话题热度计算	第44页
4.2 突发词和重要词	第44-46页
4.3 基于图结构模型的突发话题检测	第46-50页
4.3.1 图生成阶段	第47-48页
4.3.2 图剪枝-聚类阶段	第48-49页
4.3.3 话题检测阶段	第49-50页
4.4 本章小结	第50-51页
第五章实验结果与分析	第51-69页
5.1 开发环境说明	第51页
5.2 实验数据集	第51-55页
5.2.1 面向食药安全主题的数据集	第51-54页
5.2.2 突发事件语料库—CEC	第54-55页
5.3 食药安全主题爬虫算法实验与分析	第55-56页
5.4 特征提取实验与分析	第56-59页
5.4.1 话题关键词选取实验	第56-57页
5.4.2 特征提取实验	第57-59页
5.5 基于图结构模型的话题检测实验与分析	第59-65页
5.5.1 话题检测评测指标	第60页
5.5.2 话题检测效果与对比实验	第60-65页
5.6 基于图结构模型的突发话题检测实验与分析	第65-68页
5.6.1 突发话题评测指标	第65-66页
5.6.2 实验参数取值讨论	第66-67页
5.6.3 突发话题检测效果与实验对比	第67-68页
5.7 本章小结	第68-69页
第六章结论与展望	第69-71页
6.1 结论	第69-70页
6.2 展望	第70-71页
致谢	第71-72页
参考文献	第72-76页
攻读硕士学位期间取得的成果	第76页