摘要 | 第3-5页 |
Abstract | 第5-6页 |
第一章 绪论 | 第9-21页 |
第一节 研究背景及意义 | 第9-12页 |
第二节 国内外相关研究现状分析 | 第12-19页 |
一、旅游网络舆情描述与研究现状 | 第12-15页 |
二、热点话题发现技术 | 第15-17页 |
三、领域本体国内外研究综述 | 第17-19页 |
第三节 本文的研究内容及方法 | 第19页 |
第四节 论文组织安排 | 第19-21页 |
第二章 相关理论研究 | 第21-36页 |
第一节 Web文本挖掘 | 第21-23页 |
第二节 微博热点话题发现 | 第23-24页 |
第三节 微博数据采集 | 第24-27页 |
一、通过微博平台API获取微博数据 | 第24-26页 |
二、网络爬虫程序爬取微博数据 | 第26-27页 |
第四节 文本表示和分词技术 | 第27-29页 |
一、分词技术 | 第27-28页 |
二、文本表示 | 第28-29页 |
第五节 特征提取 | 第29-32页 |
第六节 文本聚类 | 第32-33页 |
第七节 热点话题演化趋势分析 | 第33-36页 |
第三章 旅游领域本体的构建 | 第36-46页 |
第一节 旅游领域本体的构建准则 | 第36页 |
第二节 旅游领域本体的构建方法 | 第36-40页 |
第三节 领域本体构建工具Protégé简介 | 第40页 |
第四节 旅游领域本体构建 | 第40-45页 |
一、需求分析 | 第41页 |
二、旅游领域概念词和术语确定 | 第41-42页 |
三、定义类和类的层次关系 | 第42页 |
四、定义类的属性 | 第42-43页 |
五、定义属性的分面 | 第43页 |
六、定义本体中的关系 | 第43-45页 |
第五节 小结 | 第45-46页 |
第四章 基于领域本体的特征提取算法 | 第46-52页 |
第一节 特征提取 | 第46-47页 |
一、Web文档特征提取 | 第46-47页 |
二、特征提取中的主要问题 | 第47页 |
第二节 基于领域本体的特征提取的提出 | 第47-50页 |
第三节 实验过程与结果分析 | 第50页 |
第四节 小结 | 第50-52页 |
第五章 基于云南领域本体的旅游网络舆情分析与仿真实验 | 第52-64页 |
第一节 云南旅游领域本体的构建 | 第52-57页 |
第二节 获取云南旅游微博数据并对其进行处理分析实验 | 第57-63页 |
一、爬取微博数据 | 第57-58页 |
二、抽出微博的原始内容并进行脚本处理 | 第58页 |
三、对处理后的微博信息进行中文分词 | 第58-59页 |
四、云南旅游微博热点话题发现 | 第59-61页 |
五、分析云南旅游微博热点话题的变化趋势 | 第61-63页 |
第三节 小结 | 第63-64页 |
第六章 总结与展望 | 第64-66页 |
第一节 总结和创新点 | 第64-65页 |
第二节 研究展望 | 第65-66页 |
参考文献 | 第66-71页 |
致谢 | 第71-73页 |
本人在读期间完成的研究成果 | 第73页 |