首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于主题的WEB信息提取及智能搜索技术研究与实现

摘要第1-7页
ABSTRACT第7-11页
第一章 绪论第11-15页
   ·研究背景及意义第11-14页
   ·本论文主要工作第14页
   ·本论文的组织第14-15页
第二章 技术介绍和讨论第15-31页
   ·基于WWW的搜索引擎第15-20页
     ·搜索引擎的组成第15-16页
     ·web crawler第16-18页
     ·排序算法第18-20页
   ·web文本信息的表示和特征获取第20页
   ·web文本相关性算法第20-24页
     ·基于元数据的判别第21页
     ·基于链接标签数据的判别第21-22页
     ·基于链接结构分析的判别第22页
     ·基于页面语义信息的判别第22-24页
   ·web文档聚类第24-30页
     ·聚类的过程第25页
     ·聚类的时机第25-26页
     ·距离和相似系数第26-27页
     ·模糊聚类算法第27-29页
     ·聚类算法评价第29-30页
   ·本章小结第30-31页
第三章 基于主题的智能搜索系统设计第31-46页
   ·系统框架第32页
   ·基于主题的crawler框架第32-40页
     ·基于页面结构分析的信息提取第33-37页
     ·主题相关性判断第37-40页
   ·模糊 C-均值聚类器第40-45页
     ·FCM算法描述第40-42页
     ·影响 FCM有效性的两个参数第42-44页
     ·FCM算法改进第44-45页
   ·本章小结第45-46页
第四章 系统实现第46-68页
   ·页面获取第46-56页
     ·种子集合的产生第47-49页
     ·多线程 Fetch第49-53页
     ·网页消重第53-56页
   ·页面分析第56-58页
     ·数据表设计及字典生成第56-58页
     ·页面表示及信息提取第58页
   ·聚类算法的实现第58-65页
     ·改进 FCM实现流程图第59-60页
     ·改进 FCM算法实现第60-64页
     ·算法测试第64-65页
   ·实现中用到的编程技术第65-67页
     ·Socket编程技术第65页
     ·ADO数据库编程第65-67页
     ·Boost库第67页
   ·本章小结第67-68页
第五章 总结与展望第68-70页
   ·本文总结第68页
   ·下一步研究工作展望第68-70页
致谢第70-71页
参考文献第71-75页
个人简历第75-76页
攻硕期间取得的研究成果第76页

论文共76页,点击 下载论文
上一篇:高放废物深地质处置库缓冲材料--高庙子膨润土基本特性研究
下一篇:高等教育国际化中的跨文化冲突与融合