基于移动终端的Web信息检索技术研究

摘要	第1-5页
ABSTRACT	第5-10页
第一章绪论	第10-14页
·研究背景与意义	第10-11页
·相关技术的国内外现状	第11-12页
·手机浏览器的发展	第11页
·移动手机搜索引擎的应用现状	第11-12页
·主要研究内容	第12页
·论文组织结构	第12-13页
·小结	第13-14页
第二章相关技术	第14-27页
·网页净化	第14-21页
·网页适应	第14页
·网页分割	第14-16页
·探测 HTML 标签	第15页
·识别视觉分割线	第15-16页
·网页主题信息抽取	第16-21页
·Wrapper方式	第17页
·DOM树模型	第17-20页
·网页模板模型	第20-21页
·站点结构模型	第21页
·全文检索	第21-22页
·全文检索引擎工具包 Lucene	第22-24页
·Lucene系统架构	第22页
·Lucene索引介绍	第22-23页
·Lucene索引结构	第23-24页
·自动摘要技术	第24-26页
·基于理解的自动摘要	第24-25页
·基于统计的自动摘要	第25页
·基于信息抽取的自动摘要	第25-26页
·构造正则表达式	第26页
·小结	第26-27页
第三章网页净化模块的设计	第27-33页
·HTML的基本概念及其结构	第27页
·HTML解析包 HTMLParser	第27-29页
·Node	第28页
·过滤器 Filter 类	第28-29页
·通过 Visitor 访问	第29页
·HTML主题信息提取	第29-32页
·小结	第32-33页
第四章信息检索模块设计	第33-40页
·创建索引	第33-34页
·查询	第34-35页
·中文分词	第35-39页
·Lucene中文分词	第36页
·最大概率分词方法	第36-37页
·中文分词算法的改进	第37-39页
·小结	第39-40页
第五章系统的整体设计与实现	第40-52页
·系统整体设计框架	第40-42页
·系统基本框架	第41页
·系统平台和开发环境	第41-42页
·网页搜索	第42-43页
·网页预处理	第43-47页
·预处理步骤	第43-46页
·线程池	第46-47页
·内容服务	第47-51页
·建立 txt 文件索引库	第47-48页
·txt文本摘要提取	第48-51页
·小结	第51-52页
第六章总结与展望	第52-53页
·总结	第52页
·展望	第52-53页
参考文献	第53-57页
致谢	第57-58页
攻读学位期间的主要研究成果	第58页