首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Web的旅游突发事件信息搜索和获取技术研究

摘要第1-5页
ABSTRACT第5-7页
目录第7-9页
第一章 引言第9-12页
   ·研究背景第9-10页
   ·研究目的第10页
   ·论文的主要工作第10-11页
   ·研究意义第11页
   ·论文的组织结构第11-12页
第二章 相关技术第12-29页
   ·垂直搜索第12页
   ·网络爬虫技术第12-17页
     ·搜索策略第13页
     ·对搜索过的URL的重复搜索的处理第13-14页
     ·对过期网页的处理策略第14-15页
     ·网络爬虫研究现状第15-17页
   ·信息检索第17-20页
     ·全文检索与全文检索系统第17-18页
     ·倒排索引的建立第18-19页
     ·Lucene信息检索系统第19-20页
   ·Web信息抽取第20-22页
     ·网页类型数据的特点第21页
     ·DOM文档对象模型第21页
     ·SAX分析方法第21-22页
     ·Html Parser第22页
     ·信息抽取的策略第22页
   ·中文分词技术第22-27页
     ·机械分词法第22-25页
     ·语义分词法第25页
     ·人工智能法第25-26页
     ·中文分词的评价标准第26-27页
   ·结构化存储第27-28页
     ·突发事件对象的构建第27页
     ·对象类型的判定第27页
     ·对象属性的填充第27页
     ·结构化数据库存储第27-28页
   ·本章小结第28-29页
第三章 相关算法的选择和改进第29-39页
   ·基于优先权的地址搜索改进算法第29-30页
   ·基于旅游突发事件特征词库的RMM分词算法的改进第30-33页
   ·基于词频的突发事件对象的分类算法的提出第33-36页
   ·结构化存储算法的提出第36-38页
   ·本章小结第38-39页
第四章 旅游突发事件自动获取原型系统的开发第39-52页
   ·系统功能概述第39-40页
   ·系统总体方案第40页
   ·系统架构第40-43页
     ·整体流程第40-42页
     ·单个网页处理过程第42-43页
   ·各个部分介绍第43-50页
     ·网络爬虫设计第43-45页
     ·网页信息抽取模块设计第45-48页
     ·中文分词模块设计第48-49页
     ·检索系统的构建第49-50页
     ·突发事件对象构建和数据库存储设计第50页
   ·系统测试结果第50-52页
第五章 结论与展望第52-54页
   ·结论第52页
   ·展望第52-54页
参考文献第54-59页
致谢第59-60页
攻读学位期间发表的学术论文第60页

论文共60页,点击 下载论文
上一篇:嵌入式网络考试系统终端软件的设计和实现
下一篇:旅游突发事件关联规则挖掘算法研究