基于文本相似度算法的京津冀特色旅游线路开发

摘要	第4-5页
Abstract	第5-6页
1 绪论	第9-14页
1.1 研究背景和意义	第9-11页
1.1.1 研究背景	第9-10页
1.1.2 研究意义	第10-11页
1.2 文献综述	第11-12页
1.2.1 文本相似度算法研究	第11页
1.2.2 旅游线路设计研究	第11-12页
1.3 研究内容与方法	第12页
1.4 研究思路与创新点	第12-14页
1.4.1 研究思路	第12-13页
1.4.2 创新点	第13-14页
2 文本处理	第14-18页
2.1 文本预处理	第14-15页
2.2 特征项选取及其权重计算	第15-16页
2.3 文本表示—空间向量模型	第16页
2.4 文本相似度算法—k-均值聚类	第16-17页
2.5 小结	第17-18页
3 基于高频词的景点特征分析	第18-21页
3.1 各景点的特征分析	第18-19页
3.2 全部景点的特征分析	第19-21页
4 基于k-均值聚类的景点特征分析	第21-27页
5 京津冀特色旅游线路开发	第27-35页
5.1 线路一：非物质文化遗产游	第27-28页
5.2 线路二：太行抗战史	第28-29页
5.3 线路三：皇家文化行	第29-30页
5.4 线路四：塞外踏春,寻古迹	第30-32页
5.5 线路五：奥运塞北游	第32-33页
5.6 线路六：滨海康养游	第33-34页
5.7 线路七：赏燕赵风景,品文化古迹	第34-35页
参考文献	第35-38页
附录一各景点高频词	第38-43页
附录二软件代码	第43-47页
后记	第47-48页
攻读学位期间取得的科研成果清单	第48页