摘要 | 第3-4页 |
abstract | 第4-5页 |
第一章 绪论 | 第9-18页 |
第一节 研究背景与研究意义 | 第9-11页 |
一、研究背景 | 第9-10页 |
二、研究意义 | 第10-11页 |
第二节 国内外研究现状 | 第11-14页 |
一、关于旅游目的地的研究 | 第11-12页 |
二、关于旅行者的研究 | 第12-13页 |
三、关于旅行流的研究 | 第13-14页 |
四、关于景区共现效应的研究 | 第14页 |
第三节 文章的创新点 | 第14-15页 |
第四节 研究内容与技术路线 | 第15-18页 |
一、研究内容 | 第15-17页 |
二、技术路线 | 第17-18页 |
第二章 网络游记文本分析的理论基础 | 第18-26页 |
第一节 中文分词理论 | 第18-19页 |
一、基于词典的分词方法 | 第18页 |
二、基于统计的分词方法 | 第18-19页 |
三、基于规则的分词方法 | 第19页 |
四、本文所选用的中文分词方法 | 第19页 |
第二节 中文文本关键词的提取 | 第19-21页 |
一、绝对词频TF算法 | 第19-20页 |
二、倒序文件频率IDF算法 | 第20页 |
三、词频—逆文件频率TF-IDF算法 | 第20-21页 |
第三节 关联规则 | 第21-23页 |
一、基本概念 | 第21-22页 |
二、Apriori算法 | 第22页 |
三、频繁模式增长算法(FP-growth) | 第22-23页 |
第四节 社会网络分析法 | 第23-24页 |
一、网络与社会网络 | 第23页 |
二、度 | 第23-24页 |
三、密度 | 第24页 |
第五节 基本概念 | 第24-26页 |
一、景点 | 第24页 |
二、热度 | 第24页 |
三、共现 | 第24-26页 |
第三章 网络游记文本预处理 | 第26-35页 |
第一节 数据的来源和选取 | 第26-28页 |
一、数据的来源 | 第26-27页 |
二、数据的选取规则 | 第27页 |
三、数据清洗 | 第27-28页 |
第二节 游记文本分词与关键词提取 | 第28-31页 |
一、游记分词与关键词提取主要步骤 | 第28页 |
二、游记分词过程部分展示 | 第28-29页 |
三、游记景点提取结果展示 | 第29-31页 |
第三节 游记景点量化建模 | 第31-35页 |
一、景点稀疏矩阵 | 第31-32页 |
二、景点共现矩阵 | 第32-35页 |
第四章 云南游记景点感知热度分析 | 第35-46页 |
第一节 关注度分析之共现次数相同处理法 | 第35-38页 |
一、共现次数相同处理法定义 | 第35-36页 |
二、共现次数相同处理法在游记文本集合中的应用 | 第36-38页 |
第二节 关注度分析之TF-IDF综合权重算法 | 第38-40页 |
一、TF-IDF综合权重法的选取依据 | 第38页 |
二、TF-IDF综合权重算法在游记文本集合中的应用 | 第38-40页 |
第三节 景点关注度的异同性分析 | 第40-44页 |
一、省内城市关注度的异同性分析 | 第40-41页 |
二、省内景点关注度的异同性分析 | 第41-43页 |
三、省外城市关注度的异同性分析 | 第43-44页 |
第四节 景点热度感知分析 | 第44-46页 |
第五章 云南游记之景点共现效应分析 | 第46-62页 |
第一节 基于关联规则的景点多重共现效应挖掘 | 第46-54页 |
一、游记文本集合中景点数量分布 | 第46-47页 |
二、游记景点稀疏矩阵的建立 | 第47-48页 |
三、基于Apriori算法的景点多重共现性挖掘 | 第48-52页 |
四、基于频繁增长模式(FP-growth)的景点多重共现性挖掘 | 第52-54页 |
第二节 基于社会网络的景点二重共现效应分析 | 第54-62页 |
一、游记景点共现矩阵的建立 | 第54-55页 |
二、云南与省外地区及城市的二重共现性分析 | 第55-56页 |
三、云南与省内城市二重共现性分析 | 第56-57页 |
四、云南省内部景点间的二重共现性分析 | 第57-62页 |
第六章 结论与展望 | 第62-65页 |
第一节 结论 | 第62-63页 |
第二节 不足与展望 | 第63-65页 |
参考文献 | 第65-70页 |
附录 | 第70-73页 |
致谢 | 第73-75页 |
本人在校期间完成的学术成果 | 第75-76页 |