首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

新闻搜索分析平台的相关技术研究

摘要第1-6页
ABSTRACT第6-10页
第1章 绪论第10-17页
   ·课题研究的背景第10页
   ·国内外研究现状第10-14页
     ·网页信息采集技术及其软件第11-12页
     ·国内外主要搜索引擎技术第12-13页
     ·国内外主要搜索引擎针对新闻搜索的优缺点第13页
     ·发展趋势第13-14页
   ·课题主要研究工作第14-15页
   ·论文结构组织第15-17页
第2章 相关的知识与技术第17-28页
   ·WEB页面的结构特点第17-18页
   ·网页信息采集技术及其软件第18-20页
     ·网络蜘蛛第18-19页
     ·抓取策略第19-20页
   ·网页抓取技术第20-21页
   ·三层结构的B/S模式第21-22页
   ·XML技术第22-23页
     ·XML定义第22-23页
     ·XML比较HTML具有的优势第23页
   ·ASP.NET基本思想及架构第23-26页
     ·.NET框架简介第24-25页
     ·ASP.NET的几项关键技术第25-26页
   ·SQL Server 2000第26-27页
   ·本章小结第27-28页
第3章 新闻搜索分析平台的构建第28-34页
   ·新闻搜索分析平台的基本原理第28-29页
   ·新闻搜索分析平台的功能第29-31页
     ·新闻分类的设计第29-30页
     ·新闻动态跟踪第30页
     ·报纸对比第30-31页
     ·新闻热点分析第31页
   ·与通用搜索引擎的数据对比第31-32页
   ·新闻搜索分析平台的特点第32页
   ·本章小结第32-34页
第4章 搜索代理和分类算法的设计第34-42页
   ·搜索引擎HttpFetch的设计第34-37页
     ·搜索引擎的数据库设计第34-35页
     ·搜索引擎的程序设计第35页
     ·针对各种信息源的抓取设计第35-36页
     ·关于时间导入的设计第36-37页
     ·javascript网站的抓取设计第37页
   ·新闻文本自动分类算法第37-41页
     ·国内外文本分类方法的研究现状第38-39页
     ·KNN算法的采用第39-40页
     ·KNN算法的设计第40-41页
   ·本章小结第41-42页
第5章 关键算法设计第42-55页
   ·基于新闻要素的关键词文本去重算法第42-43页
   ·网页去噪算法第43-47页
     ·页面内容结构表示第43-45页
     ·去噪算法设计依据第45页
     ·去噪算法思想第45-46页
     ·去噪算法设计第46-47页
   ·新闻网页主题要素的抽取方法第47-49页
     ·时间短语的抽取第48-49页
     ·地点短语的抽取第49页
     ·时间、地点短语与事件的联系第49页
   ·文本去重算法第49-54页
     ·网页重复的特点第49-50页
     ·去重技术的现状第50-51页
     ·去重算法的设计第51-54页
   ·本章小结第54-55页
结论第55-56页
参考文献第56-60页
攻读硕士学位期间发表的论文和取得的科研成果第60-61页
致谢第61-62页
个人简历第62页

论文共62页,点击 下载论文
上一篇:基于图像序列的运动目标检测与跟踪
下一篇:基于进程代数的信息化建模与仿真