首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于领域主题的Web信息检索技术研究

摘要第6-8页
Abstract第8-9页
第一章 绪论第10-14页
    1.1 基于领域主题的Web信息检索技术研究背景第10页
    1.2 基于领域主题的Web信息检索技术研究状况第10-12页
    1.3 论文的组织结构第12-14页
第二章 基于领域主题的中文Web搜索引擎关键技术组成第14-34页
    2.1 系统架构第14-18页
        2.1.1 搜索引擎的分类第14-15页
        2.1.2 通用搜索引擎系统架构第15-17页
        2.1.3 通用搜索引擎与基于领域主题的搜索引擎的比较第17-18页
    2.2 中文分词第18-22页
        2.2.1 中文分词和搜索引擎第18页
        2.2.2 中文自动分词的关键问题第18-20页
        2.2.3 分词算法第20-22页
    2.3 聚焦爬虫技术第22-28页
        2.3.1 聚焦爬虫概念及工作原理第22-23页
        2.3.2 聚焦爬虫系统体系结构第23-25页
        2.3.3 抓取目标描述第25-26页
        2.3.4 网页搜索策略第26页
        2.3.5 网页分析算法第26-28页
    2.4 网页排序技术第28-31页
    2.5 中文文本自动分类第31-32页
    2.6 索引和搜索第32-34页
第三章 站点范围内Web页面主要内容块提取算法第34-42页
    3.1 把Web页面分成块第34-37页
        3.1.1 块的有关定义第34-36页
        3.1.2 块的特征选择第36页
        3.1.3 块的权重计算第36-37页
    3.2 ContentExtractor主要内容块提取算法第37-40页
        3.2.1 算法描述第37-40页
        3.2.2 算法分析第40页
    3.3 测试数据和实验结果第40-42页
第四章 基于简化贝叶斯网络的文本分类方法第42-48页
    4.1 简化贝叶斯网络模型第42-46页
        4.1.1 贝叶斯网络模型第42-44页
        4.1.2 简化的贝叶斯网络模型第44-45页
        4.1.3 简化的贝叶斯网络模型结构学习算法第45-46页
        4.1.4 算法性能分析第46页
    4.2 利用简化的贝叶斯网络分类器实现文本分类第46-47页
    4.3 测试数据和实验结果第47-48页
第五章 基于决策树方法的特定主题Web搜索策略第48-58页
    5.1 概述第48-49页
    5.2 Web页面样本的收集第49页
    5.3 Web页面的特征提取第49-50页
    5.4 利用决策树来提取简化关键字布尔表达式第50-55页
    5.5 实验及结果第55-58页
第六章 总结与展望第58-60页
    6.1 总结第58-59页
    6.2 展望第59-60页
参考文献第60-64页
致谢第64-65页
攻读硕士学位期间发表的论文第65-66页
学位论文评阅及答辩情况表第66页

论文共66页,点击 下载论文
上一篇:济南铁路局运输综合管理信息系统开发
下一篇:控制对接接头角变形拘束焊问题的数值分析