基于文本分析的用户创作内容质量评估

摘要	第4-5页
ABSTRACT	第5页
第一章绪论	第9-16页
1.1 研究背景与意义	第9-10页
1.1.1 研究背景	第9页
1.1.2 研究意义	第9-10页
1.2 国内外研究现状	第10-12页
1.2.1 国外研究现	第10-11页
1.2.2 国内研究现状	第11-12页
1.3 直接工作基础	第12-13页
1.4 论文的主要工作	第13-14页
1.5 论文的组织结构	第14-16页
第二章相关知识	第16-26页
2.1 机器学习算法	第16-19页
2.1.1 支持向量机	第16-18页
2.1.2 条件随机场	第18-19页
2.2 文本分析常用特征	第19-21页
2.2.1 命名实体识别	第19-20页
2.2.2 LDA主题模型	第20页
2.2.3 句法分析	第20-21页
2.2.4 词向量	第21页
2.3 特征选择算法	第21-24页
2.3.1 卡方检验	第22-23页
2.3.2 信息增益	第23-24页
2.4 元学习	第24-25页
2.5 本章小结	第25-26页
第三章用户创作内容质量评估系统总体设计	第26-31页
3.1 实验平台	第26页
3.2 系统流程	第26-27页
3.3 实验语料的采集	第27-28页
3.4 基线系统简介	第28-30页
3.4.1 基线系统基本框架	第28-29页
3.4.2 基线系统实验效果	第29-30页
3.5 本章小结	第30-31页
第四章 UGC质量评估模型特征实验的结果与分析	第31-49页
4.1 LDA主题模型特征实验	第31-33页
4.1.1 主题数的确定	第31-32页
4.1.2 实验结果和分析	第32-33页
4.2 句法分析特征实验	第33-37页
4.2.1 短语句法结构	第34-35页
4.2.2 依存关系	第35页
4.2.3 实验结果和分析	第35-37页
4.3 基于词的特征实验	第37-43页
4.3.1 卡方检验和信息增益	第37-39页
4.3.2 属性选择	第39-40页
4.3.3 特征词的赋值方法	第40页
4.3.4 实验结果和分析	第40-43页
4.4 引入卡方检验和信息增益的句法分析实验	第43-44页
4.4.1 短语结构特征实验	第43-44页
4.4.2 依存关系特征实验	第44页
4.5 词向量与段向量特征实验	第44-48页
4.5.1 词向量特征实验与结果分析	第44-47页
4.5.2 段向量特征实验与结果分析	第47-48页
4.6 本章小结	第48-49页
第五章特征融合实验	第49-58页
5.1 特征层面的融合实验	第50页
5.2 质量评估模型层面的融合实验	第50-56页
5.2.1 加权平均法	第51-52页
5.2.2 扩充用户创作内容质量评估模型数量	第52-53页
5.2.3 规则方法:多数投票法	第53页
5.2.4 D-S证据理论	第53-55页
5.2.5 元学习框架	第55-56页
5.3 本章小结	第56-58页
第六章总结与展望	第58-61页
6.1 本文工作总结	第58页
6.2 对未来的展望	第58-61页
参考文献	第61-65页
致谢	第65-67页
作者攻读学位期间发表的学术论文目录	第67页