首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于移动终端的Web信息检索技术研究

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-14页
   ·研究背景与意义第10-11页
   ·相关技术的国内外现状第11-12页
     ·手机浏览器的发展第11页
     ·移动手机搜索引擎的应用现状第11-12页
   ·主要研究内容第12页
   ·论文组织结构第12-13页
   ·小结第13-14页
第二章 相关技术第14-27页
   ·网页净化第14-21页
     ·网页适应第14页
     ·网页分割第14-16页
       ·探测 HTML 标签第15页
       ·识别视觉分割线第15-16页
     ·网页主题信息抽取第16-21页
       ·Wrapper方式第17页
       ·DOM树模型第17-20页
       ·网页模板模型第20-21页
       ·站点结构模型第21页
   ·全文检索第21-22页
   ·全文检索引擎工具包 Lucene第22-24页
     ·Lucene系统架构第22页
     ·Lucene索引介绍第22-23页
     ·Lucene索引结构第23-24页
   ·自动摘要技术第24-26页
     ·基于理解的自动摘要第24-25页
     ·基于统计的自动摘要第25页
     ·基于信息抽取的自动摘要第25-26页
   ·构造正则表达式第26页
   ·小结第26-27页
第三章 网页净化模块的设计第27-33页
   ·HTML的基本概念及其结构第27页
   ·HTML解析包 HTMLParser第27-29页
     ·Node第28页
     ·过滤器 Filter 类第28-29页
     ·通过 Visitor 访问第29页
   ·HTML主题信息提取第29-32页
   ·小结第32-33页
第四章 信息检索模块设计第33-40页
   ·创建索引第33-34页
   ·查询第34-35页
   ·中文分词第35-39页
     ·Lucene中文分词第36页
     ·最大概率分词方法第36-37页
     ·中文分词算法的改进第37-39页
   ·小结第39-40页
第五章 系统的整体设计与实现第40-52页
   ·系统整体设计框架第40-42页
     ·系统基本框架第41页
     ·系统平台和开发环境第41-42页
   ·网页搜索第42-43页
   ·网页预处理第43-47页
     ·预处理步骤第43-46页
     ·线程池第46-47页
   ·内容服务第47-51页
     ·建立 txt 文件索引库第47-48页
     ·txt文本摘要提取第48-51页
   ·小结第51-52页
第六章 总结与展望第52-53页
   ·总结第52页
   ·展望第52-53页
参考文献第53-57页
致谢第57-58页
攻读学位期间的主要研究成果第58页

论文共58页,点击 下载论文
上一篇:基于WCF的电子病历系统服务端的设计与开发
下一篇:基于非线性的电子商务可信性研究