基于词向量的短文本分类方法研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第12-17页
1.1 研究背景及意义	第12-13页
1.2 相关研究概述	第13-15页
1.3 主要工作与组织结构	第15-16页
1.4 本章小结	第16-17页
第2章相关技术与理论	第17-28页
2.1 文本表达	第17-19页
2.1.1 向量空间模型	第17-18页
2.1.2 词语的分布式表达——词向量	第18-19页
2.2 特征扩展方法	第19-21页
2.2.1 利用主题模型对短文本进行扩展	第19-20页
2.2.2 利用外部知识库扩展	第20-21页
2.3 特征选择方法	第21-24页
2.3.1 文档频率与逆文档频率	第22页
2.3.2 互信息	第22-23页
2.3.3 信息增益	第23-24页
2.3.4 卡方统计量	第24页
2.4 常用分类方法	第24-27页
2.4.1 支持向量机	第24-26页
2.4.2 朴素贝叶斯	第26-27页
2.5 本章小结	第27-28页
第3章词向量学习算法	第28-45页
3.1 基于主题模型的词向量	第28-32页
3.1.1 隐含狄利克雷分布主题模型	第28-30页
3.1.2 主题分布词向量	第30-32页
3.2 加权的连续词袋模型	第32-44页
3.2.1 Word2vec模型	第32-37页
3.2.2 加权连续词袋模型结构	第37-38页
3.2.3 Hierarchical softmax	第38-41页
3.2.4 随机梯度下降求解模型	第41-44页
3.3 本章小结	第44-45页
第4章基于词向量的短文本分类	第45-56页
4.1 基于词向量的短文本分类流程	第45-46页
4.2 短文本向量生成——词向量组合法	第46-48页
4.2.1 选择性词向量累加	第46-47页
4.2.2 多种词向量协同表达特征	第47-48页
4.3 短文本向量生成——max-PV-DM模型	第48-53页
4.3.1 PV-DM模型和PV-DBOW模型	第48-49页
4.3.2 max-PV-DM模型	第49-52页
4.3.3 短文本向量构成	第52-53页
4.4 基于词向量的短文本扩展	第53-55页
4.5 本章小结	第55-56页
第5章实验设计与结果分析	第56-67页
5.1 实验数据	第56-57页
5.2 实验环境	第57页
5.3 评价指标	第57-59页
5.4 分类方法对比实验	第59-63页
5.5 关于词向量模型参数的实验	第63-64页
5.6 关于特征扩展方法的实验	第64-66页
5.7 本章小结	第66-67页
第6章短文本分类算法集成应用	第67-73页
6.1 面向公共安全的跨媒体理论与方法验证平台	第67-68页
6.2 新闻标题分类模块	第68-72页
6.2.1 数据预处理	第69-70页
6.2.2 词向量学习	第70-71页
6.2.3 人工标注训练数据	第71页
6.2.4 新闻分类服务	第71-72页
6.3 本章小结	第72-73页
第7章总结与展望	第73-75页
7.1 全文总结	第73页
7.2 下一步研究方向	第73-75页
参考文献	第75-79页
攻读硕士学位期间主要的研究成果	第79-80页
致谢	第80-81页
作者简介	第81页