基于维基百科的文本样本扩展方法及其应用研究

摘要	第6-7页
abstract	第7-8页
第一章绪论	第12-19页
1.1 研究背景与意义	第12-13页
1.2 研究现状概况	第13-16页
1.2.1 基于外部语料库的样本扩展方法	第14-15页
1.2.2 基于内部语义的样本扩展方法	第15-16页
1.2.3 样本扩展方法面临的问题	第16页
1.3 论文的主要研究内容	第16-18页
1.4 本文组织	第18-19页
第二章相关技术	第19-35页
2.1 相关度计算	第19-22页
2.1.1 基于语义网络的词语项相关度计算	第20-21页
2.1.2 基于语料库的词语项相关度计算	第21-22页
2.2 知识图谱	第22-31页
2.2.1 知识图谱概述	第22-24页
2.2.2 基于知识图谱的样本扩展	第24-26页
2.2.3 维基百科	第26-28页
2.2.4 维基百科的知识图谱链接图	第28-31页
2.3 主题提取	第31-34页
2.3.1 基于模型的主题提取技术	第31-32页
2.3.2 基于知识库的主题提取技术	第32-34页
2.4 小结	第34-35页
第三章基于维基百科的样本扩展算法	第35-49页
3.1 概述	第35页
3.2 相关工作	第35-37页
3.3 算法理论依据	第37-39页
3.4 相关度计算方法	第39-43页
3.4.1 主题信息相关度	第39-41页
3.4.2 链接语义相关度	第41-43页
3.5 基于维基百科的样本扩展方法	第43-47页
3.5.1 基于主题的扩展	第44-45页
3.5.2 基于链接的扩展	第45-46页
3.5.3 基于主题和链接的扩展	第46-47页
3.6 小结	第47-49页
第四章基于文本样本扩展的应用研究	第49-74页
4.1 概述	第49-50页
4.2 文本分类	第50-54页
4.2.1 文本分类模型	第50-53页
4.2.2 基于样本扩展的文本分类	第53-54页
4.3 文本聚类	第54-57页
4.3.1 文本聚类模型	第55-56页
4.3.2 基于样本扩展的文本聚类	第56-57页
4.4 实验设计	第57-62页
4.4.1 实验数据和工具	第57-58页
4.4.2 数据预处理	第58-60页
4.4.3 实验步骤	第60-61页
4.4.4 评估指标	第61-62页
4.5 实验结果与分析	第62-74页
4.5.1 不同样本扩展数量的分类	第62-65页
4.5.2 不同分类模型的分类	第65-66页
4.5.3 不同测试数据集的分类	第66-68页
4.5.4 不同类别数量的分类	第68-69页
4.5.5 聚类模型的应用	第69-71页
4.5.6 时间效率的研究	第71-72页
4.5.7 结论	第72-74页
第五章总结与展望	第74-77页
5.1 总结	第74-75页
5.2 展望	第75-77页
参考文献	第77-83页
作者在攻读硕士学位期间公开发表的论文	第83-84页
作者在攻读硕士学位期间所作的项目	第84-85页
致谢	第85页