摘要 | 第4-6页 |
Abstract | 第6-7页 |
1 绪论 | 第11-17页 |
1.1 研究背景及意义 | 第11-12页 |
1.1.1 研究背景 | 第11-12页 |
1.1.2 研究意义 | 第12页 |
1.2 国内外研究现状 | 第12-14页 |
1.2.1 国外研究现状 | 第12-13页 |
1.2.2 国内研究现状 | 第13-14页 |
1.3 研究方法 | 第14页 |
1.3.1 文献研究法 | 第14页 |
1.3.2 描述性统计方法 | 第14页 |
1.3.3 数据挖掘方法 | 第14页 |
1.4 研究思路与创新点 | 第14-17页 |
1.4.1 研究思路 | 第14-15页 |
1.4.2 创新点 | 第15-17页 |
2 京津冀三地旅游业现状分析 | 第17-22页 |
2.1 京津冀国内旅游现状分析 | 第17-18页 |
2.2 京津冀入境旅游现状分析 | 第18-19页 |
2.3 京津冀旅游资源分析 | 第19-22页 |
3 数据采集 | 第22-26页 |
3.1 京津冀景点选取分析 | 第22页 |
3.2 爬虫过程及注意事项 | 第22-23页 |
3.3 景点评论数据来源 | 第23-24页 |
3.4 景点评论数据描述性分析 | 第24-26页 |
4 数据预处理 | 第26-28页 |
4.1 分词 | 第26页 |
4.2 添加自定义词典 | 第26页 |
4.3 过滤停用词 | 第26-27页 |
4.4 提取关键词 | 第27页 |
4.5 高频词统计 | 第27-28页 |
5 基于评论的京津冀旅游发展的优劣势分析 | 第28-41页 |
5.1 北京5A级景点的优劣势分析 | 第29-33页 |
5.1.1 北京5A级景点的优势分析 | 第29-31页 |
5.1.2 北京5A级景点的劣势分析 | 第31-33页 |
5.2 天津5A级景点的优劣势分析 | 第33-36页 |
5.2.1 天津5A级景点的优势分析 | 第33-35页 |
5.2.2 天津5A级景点的劣势分析 | 第35-36页 |
5.3 河北4A级及以上景点的优劣势分析 | 第36-41页 |
5.3.1 河北4A级及以上景点的优势分析 | 第36-37页 |
5.3.2 河北4A级及以上景点的劣势分析 | 第37-41页 |
6 基于低分评论的河北旅游发展影响因素分析 | 第41-49页 |
6.1 河北景点聚类分析 | 第41-44页 |
6.1.1 景点文本数据合并过程 | 第41-42页 |
6.1.2 文本TF-IDF计算及其意义 | 第42-43页 |
6.1.3 文本数据化表示模型 | 第43页 |
6.1.4 基于文本相似度的景点聚类分析 | 第43-44页 |
6.2 不同类别景点存在的突出问题 | 第44-49页 |
6.2.1 第一类旅游景点发展影响因素分析 | 第45-46页 |
6.2.2 第二类旅游景点发展影响因素分析 | 第46页 |
6.2.3 第三类旅游景点发展影响因素分析 | 第46-47页 |
6.2.4 第四类旅游景点发展影响因素分析 | 第47页 |
6.2.5 第五类旅游景点发展影响因素分析 | 第47-49页 |
7 结论与建议 | 第49-54页 |
7.1 结论 | 第49-51页 |
7.1.1 针对京津冀三地旅游业现状分析结论 | 第49-50页 |
7.1.2 针对数据采集过程中的结论 | 第50页 |
7.1.3 基于景点评论京津冀旅游发展优劣势分析结论 | 第50-51页 |
7.1.4 不同类别景点存在的突出问题结论 | 第51页 |
7.2 建议 | 第51-54页 |
7.2.1 抓住机遇,打破地域界限,做到资源共享 | 第51-52页 |
7.2.2 共同问题共同治理,不同问题相互借鉴 | 第52页 |
7.2.3 河北旅游业自身需不断完善 | 第52-54页 |
参考文献 | 第54-58页 |
后记 | 第58-59页 |
攻读学位期间取得的科研成果清单 | 第59页 |