首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向特定领域的主题搜索系统的研究与实现

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-14页
   ·研究背景和意义第10-11页
   ·主题搜索的研究现状第11-12页
   ·本文的主要工作及论文组织结构第12-14页
     ·本文的主要工作第12-13页
     ·本文的组织结构第13-14页
第二章 主题搜索相关技术综述第14-26页
   ·主题爬虫技术第14-17页
     ·通用网络爬虫简介第14-15页
     ·主题网络爬虫第15-16页
     ·主题爬虫关键技术第16-17页
   ·信息过滤技术第17-19页
     ·信息过滤的研究现状第17页
     ·信息过滤的实质第17-18页
     ·信息过滤相关技术研究第18-19页
   ·Web信息抽取技术第19-21页
     ·Web信息抽取概述第19-20页
     ·Web信息抽取方法研究第20-21页
   ·文本分类技术第21-24页
     ·文本表示模型第21-22页
     ·特征选择技术第22-23页
     ·文本分类技术第23-24页
   ·增量搜集技术第24-25页
     ·增量搜集的概念第24页
     ·增量搜集的研究现状第24-25页
   ·本章小结第25-26页
第三章 网页过滤技术的研究第26-38页
   ·网页过滤研究的前提第26-27页
   ·基于双重特征选择的网页过滤第27-32页
     ·CHI特征选择方法的改进第27-30页
     ·双重特征选择算法第30-31页
     ·VSM权值计算方法第31-32页
   ·网页过滤实验第32-37页
     ·评价标准第32-33页
     ·实验步骤第33-34页
     ·实验结果与分析第34-37页
   ·本章小结第37-38页
第四章 增量搜集技术的研究第38-58页
   ·领域网页信息变化的研究第38-42页
     ·相关定义第38-40页
     ·领域站点信息变化特点第40-42页
   ·增量搜集模型的研究第42-52页
     ·增量搜集的对象第42-44页
     ·如何进行增量搜集第44-49页
     ·何时进行增量搜集第49-52页
   ·增量搜集实验第52-56页
     ·判断关键列表页面的实验第52-53页
     ·抓取页面增量信息的实验第53-54页
     ·预测页面下次更新时间的实验第54-56页
   ·本章小结第56-58页
第五章 面向招标领域的主题搜索系统的实现第58-70页
   ·系统介绍第58-59页
   ·爬虫模块第59-62页
   ·网页过滤模块第62-63页
   ·网页解析模块第63-66页
     ·标题与正文节点的定位第63-64页
     ·结构化元素项的抽取第64-66页
   ·文本分类模块第66-68页
     ·招标信息的行业分类第66-67页
     ·招标信息的地域分类第67-68页
   ·增量搜集模块第68-69页
   ·本章小结第69-70页
第六章 总结与展望第70-72页
   ·本文研究工作的总结第70-71页
   ·未来工作的展望第71-72页
参考文献第72-76页
致谢第76-77页
攻读学位期间发表的学术论文目录第77页

论文共77页,点击 下载论文
上一篇:基于虚拟磁盘和在线存储接口的云存储系统设计与实现
下一篇:基于双层规划的移动应用商店利润分成研究