房地产信息垂直搜索引擎技术研究

摘要	第1-6页
ABSTRACT	第6-8页
目录	第8-11页
第一章绪论	第11-15页
·研究背景与意义	第11页
·搜索引擎的概述	第11-13页
·垂直搜索引擎的现状与发展	第13-14页
·论文的相关工作	第14-15页
第二章垂直搜索引擎的相关技术	第15-22页
·页面下载技术	第15-17页
·深度优先搜索策略	第15-16页
·广度优先搜索策略	第16页
·去重抓取策略	第16-17页
·网页信息结构化	第17页
·中文分词	第17-19页
·信息索引技术	第19-20页
·前向索引	第19页
·倒排索引	第19-20页
·网页搜索结果排序技术	第20-21页
·PageRank 算法	第20-21页
·Hits 算法	第21页
·本章小结	第21-22页
第三章基于改进型 Shark-Search 算法的聚焦网络爬虫	第22-41页
·聚焦网络爬虫	第22-26页
·聚焦网络爬虫的原理	第22-23页
·聚焦网络爬虫的基本架构	第23-26页
·基于网页内容分析的算法	第26-31页
·Fish-Search 算法	第27-29页
·Shark-Search 算法	第29-31页
·基于链接聚类与隧道技术的 Shark-Search 算法的改进	第31-37页
·链接聚类	第32-33页
·隧道技术	第33-34页
·改进后的 Shark-Search 算法	第34-37页
·聚焦网络爬虫评价指标	第37-38页
·有效性	第37-38页
·实验结果与分析	第38-40页
·本章小结	第40-41页
第四章基于概率模型与词性标注的命名实体识别	第41-51页
·中文分词的技术难点	第41-42页
·歧义词的识别难点	第41-42页
·未登录词的识别难点	第42页
·中文分词算法介绍	第42-46页
·基于词典与规则的中文分词	第43-44页
·基于统计的中文分词	第44-45页
·基于理解的中文分词	第45-46页
·隐马尔可夫与词性标注	第46-49页
·隐马尔可夫模型	第46-47页
·中文词性标注	第47页
·房地产命名的识别	第47-49页
·中文分词的评测标准	第49页
·实验结果与分析	第49-50页
·本章小结	第50-51页
第五章房地产垂直搜索引擎的设计与实现	第51-67页
·系统的开发环境	第51页
·设计思想	第51页
·系统的体系结构及业务流程	第51-54页
·系统各个模块的实现	第54-61页
·网络爬虫模块	第54-55页
·页面处理模块	第55-57页
·中文分词模块	第57页
·信息索引模块	第57-59页
·用户检索模块	第59-61页
·关键配置信息	第61-63页
·实验结果及分析	第63-66页
·本章小结	第66-67页
第六章总结与展望	第67-68页
·本文总结	第67页
·未来工作展望	第67-68页
致谢	第68-69页
参考文献	第69-73页
附录	第73-74页
详细摘要	第74-78页