基于文本相似度算法的京津冀特色旅游线路开发
摘要 | 第4-5页 |
Abstract | 第5-6页 |
1 绪论 | 第9-14页 |
1.1 研究背景和意义 | 第9-11页 |
1.1.1 研究背景 | 第9-10页 |
1.1.2 研究意义 | 第10-11页 |
1.2 文献综述 | 第11-12页 |
1.2.1 文本相似度算法研究 | 第11页 |
1.2.2 旅游线路设计研究 | 第11-12页 |
1.3 研究内容与方法 | 第12页 |
1.4 研究思路与创新点 | 第12-14页 |
1.4.1 研究思路 | 第12-13页 |
1.4.2 创新点 | 第13-14页 |
2 文本处理 | 第14-18页 |
2.1 文本预处理 | 第14-15页 |
2.2 特征项选取及其权重计算 | 第15-16页 |
2.3 文本表示—空间向量模型 | 第16页 |
2.4 文本相似度算法—k-均值聚类 | 第16-17页 |
2.5 小结 | 第17-18页 |
3 基于高频词的景点特征分析 | 第18-21页 |
3.1 各景点的特征分析 | 第18-19页 |
3.2 全部景点的特征分析 | 第19-21页 |
4 基于k-均值聚类的景点特征分析 | 第21-27页 |
5 京津冀特色旅游线路开发 | 第27-35页 |
5.1 线路一:非物质文化遗产游 | 第27-28页 |
5.2 线路二:太行抗战史 | 第28-29页 |
5.3 线路三:皇家文化行 | 第29-30页 |
5.4 线路四:塞外踏春,寻古迹 | 第30-32页 |
5.5 线路五:奥运塞北游 | 第32-33页 |
5.6 线路六:滨海康养游 | 第33-34页 |
5.7 线路七:赏燕赵风景,品文化古迹 | 第34-35页 |
参考文献 | 第35-38页 |
附录一 各景点高频词 | 第38-43页 |
附录二 软件代码 | 第43-47页 |
后记 | 第47-48页 |
攻读学位期间取得的科研成果清单 | 第48页 |