首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎智能化技术中若干关键问题的研究与实现

摘要第1-5页
Abstract第5-11页
第1章 绪论第11-21页
   ·研究课题的选题背景和意义第11-12页
   ·国内外相关工作综述第12-19页
     ·网页信息动态采集技术第12-13页
     ·中文网页正文提取技术第13-15页
     ·自动文档摘要技术第15-17页
     ·文本自动分类技术第17-18页
     ·网页去重技术第18-19页
   ·论文的工作与组织结构第19-21页
     ·论文的主要研究工作第19-20页
     ·论文内容安排第20-21页
第2章 基于网站优先级调整的网页信息动态采集算法第21-27页
   ·算法流程图第21-23页
   ·网页时新度算法第23页
   ·基于网页时新度的网站优先级调整算法第23-25页
   ·基于网站优先级的多线程网页信息采集技术第25-26页
   ·根据网页类别确定优先级第26页
   ·本章小结第26-27页
第3章 基于文字密度的网页正文提取算法的研究第27-33页
   ·算法流程图第27页
   ·正文文本特征的识别与处理第27-28页
   ·网页源码的预处理第28-29页
   ·网页正文源码行中文密度的计算第29页
   ·网页源码正文分块第29页
   ·去除伪网页源码正文块第29-31页
   ·辅助网页源码正文识别方法第31页
   ·网页正文原始格式的保留问题第31页
   ·本章小结第31-33页
第4章 基于主题词标引的网页分类算法研究第33-52页
   ·概述第33-34页
   ·开放性测试和封闭性测试第34-35页
   ·算法性能评估指标第35-36页
   ·与网页分类算法相关的基础性研究第36-42页
     ·文本的表示第36-37页
     ·构建基于向量模板的向量空间模型第37页
     ·构建基于哈希表的向量空间模型第37-39页
     ·基于概念分析的主题词抽取算法第39-40页
     ·一种改进的向量余弦相似度算法第40-42页
   ·基于主题词标引的类别中心向量分类算法第42-46页
     ·生成分类器模型第43页
     ·分类算法第43页
     ·向量的归一化第43页
     ·兼取类别数对分类准确性的影响第43-44页
     ·文档类别分布对分类正确率的影响第44页
     ·中心向量的修正算法第44-46页
     ·分类算法的自适应性第46页
   ·KNN(K 近邻)分类算法第46-48页
   ·CKNN(聚类K 近邻)分类算法第48-50页
   ·本章小结第50-52页
第5章 基于相似度的文本摘要方法的研究第52-64页
   ·基于相似度的文本摘要方法第52页
   ·文档结构模型第52页
   ·分段和分句第52-54页
   ·主题词的提取第54-55页
     ·主题词串的向量化第54页
     ·构建文档结构向量空间模型第54-55页
   ·计算文档结构各部分的权重第55-57页
   ·正规则和负规则第57页
   ·用户倾向性词表第57页
   ·基于语句相似度的语句冗余度算法第57-58页
   ·摘要和原文比例的确定第58页
   ·摘要句的选取和摘要的生成第58页
   ·本文摘要技术在提取中文网页摘要中的应用第58-63页
     ·预提取网页正文对提高摘要准确性的作用第59-62页
     ·提高摘要算法实时性的措施第62-63页
   ·本章小结第63-64页
第6章 实验设计和数据分析第64-88页
   ·基于网站优先级调整的网页信息动态采集技术的实验及分析第65-70页
     ·实验设计第65-66页
     ·数据分析第66-69页
     ·存在的不足及下一步的改进工作第69-70页
   ·基于中文密度算法的中文网页正文提取技术的实验及分析第70-71页
     ·实验设计第70页
     ·数据分析第70页
     ·存在的不足及下一步的改进工作第70-71页
   ·课题中两种文档向量表示方法的比较性实验及分析第71-74页
     ·试验设计第71页
     ·数据分析第71-74页
   ·改进的余弦向量相似度算法的实验及分析第74-76页
     ·试验设计第74页
     ·数据分析第74-76页
   ·基于主题词标引的类别中心向量分类算法的实验及分析第76-79页
     ·试验设计第76页
     ·数据分析第76-78页
     ·存在的问题和下一步的工作第78-79页
   ·CKNN 分类算法的实验及分析第79-80页
     ·试验设计第79页
     ·数据分析第79-80页
     ·存在的问题和下一步的工作第80页
   ·KNN 分类算法的试验设计和数据分析第80-82页
     ·试验设计第80-81页
     ·数据分析第81-82页
   ·类别中心向量分类算法、CKNN 分类算法和KNN 分类算法的性能比较第82-83页
     ·试验设计第82页
     ·数据分析第82-83页
   ·基于相似度的文档摘要技术的实验及数据分析第83-85页
     ·试验设计第83-84页
     ·数据分析第84-85页
     ·存在的问题和下一步的工作第85页
   ·网页信息搜集系统的实验及数据分析第85-87页
     ·试验设计第85-86页
     ·数据分析第86页
     ·存在的问题和下一步的工作第86-87页
   ·本章小结第87-88页
第7章 网页信息动态采集系统的设计与实现第88-95页
   ·系统的构成第88-89页
   ·系统各模块的集成第89-93页
   ·网页分类模块的自适应性第93页
   ·系统运行状态监测程序第93页
   ·基于主题词标引的网页去重方法第93-94页
   ·本章小结第94-95页
总结第95-97页
参考文献第97-101页
攻读硕士学位期间所发表的论文第101-102页
致谢第102-103页
个人简历第103页
攻读硕士学位期间参与的科研项目第103页

论文共103页,点击 下载论文
上一篇:基于B/S模式的网络考试系统
下一篇:基于SSI2的高校科研管理系统的研究及实现