首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于自然语言处理的网页去重关键技术研究

摘要第1-5页
ABSTRACT第5-8页
第一章 引言第8-13页
   ·网页去重技术的研究目的和意义第8-9页
   ·网页去重在互联网中的应用第9-12页
     ·搜索引擎中的应用第9-11页
     ·竞争情报系统中的应用第11页
     ·其他方面的应用第11-12页
   ·本文要解决的问题第12页
   ·本文组织结构第12-13页
第二章 相关研究工作概述第13-28页
   ·文本复制检测简介第13-14页
   ·网页去重研究介绍第14-25页
     ·国外常用的网页查重算法介绍第15-19页
     ·国外几种网页查重算法比较第19-20页
     ·国内常用的网页查重算法介绍第20-25页
   ·现有网页去重算法分析第25-28页
第三章 基于信息检索的网页去重算法第28-49页
   ·算法设计第28-31页
     ·算法基础第28-29页
     ·算法思路第29-30页
     ·算法流程第30页
     ·算法框图第30-31页
   ·算法实现第31-32页
     ·网页文本的预处理第31页
     ·检索的相关度度量第31-32页
     ·网页间相似度计算第32页
   ·算法中的关键问题第32-41页
     ·选取网页文本的关键词算法第32-39页
     ·构建高效的信息检索模型第39-41页
   ·算法分析和实验第41-49页
     ·实验评价指标第41-42页
     ·算法的时空复杂度第42-43页
     ·相关度、相似度阈值第43-45页
     ·与其他算法对比第45-47页
     ·算法抗噪声性分析第47-49页
第四章 智能网页文本处理系统第49-53页
   ·系统总体介绍第49-50页
     ·背景介绍第49-50页
     ·名词术语定义第50页
   ·系统总体设计第50-53页
     ·需求规定第50页
     ·开发语言和运行环境第50-51页
     ·基本设计概念和处理流程第51-52页
     ·系统状态图第52页
     ·功能需求与程序的关系第52-53页
   ·网页文本去重模块第53页
第五章 总结第53-55页
   ·本文工作总结第53-54页
   ·下一步研究方向第54-55页
参考文献第55-57页
致谢第57-58页
作者攻读学位期间发表的学术论文目录第58页

论文共58页,点击 下载论文
上一篇:一种基于Internet电子商务安全系统的设计与实现
下一篇:复杂问题中文问答系统中答案筛选与验证算法研究