首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

NERMS中基于Internet的搜索引擎研究与实现

第一章 概述第6-12页
    1.1 搜索引擎的意义第6页
    1.2 搜索引擎的概念、产生和发展第6-10页
        1.2.1 搜索引擎的基本概念第6-7页
        1.2.2 搜索引擎的分类第7-8页
        1.2.3 搜索引擎的发展第8-10页
        1.2.4 搜索引擎的评价标准第10页
    1.3 本文所做的工作第10-12页
第二章 页面收集和站点爬行第12-23页
    2.1 Spider程序第12页
    2.2 使用HTTP访问站点第12-17页
        2.2.1 分析HTTP协议第12页
        2.2.2 地址格式第12-15页
        2.2.3 使用套接字进行HTTP编程第15-17页
    2.3 使用HTTPS访问加密站点第17-20页
        2.3.1 HTTP与HTTPS第17-18页
        2.3.2 HTTP用户认证第18-20页
    2.4 发送表单第20-21页
        2.4.1 仿真表单第20页
        2.4.2 不安全字符与URL编码第20-21页
    2.5 探索Cookie第21-22页
        2.5.1 Cookie的Internet标准第21-22页
        2.5.2 处理会话Cookie和永久Cookie第22页
    2.6 小结第22-23页
第三章 页面解析和索引词汇的提取第23-35页
    3.1 页面解析第23-24页
        3.1.1 解析HTML第23-24页
    3.2 文本预处理第24-26页
        3.2.1 文本预处理的过程第24页
        3.2.2 文本的词法分析第24-25页
        3.2.3 中文分词技术第25页
        3.2.4 无用词汇的删除第25页
        3.2.5 词干提取技术第25-26页
        3.2.6 索引词条的选择第26页
        3.2.7 词典第26页
    3.3 基于规则的中文分词第26-33页
        3.3.1 交集型切分歧义的分类第27-30页
        3.3.2 歧义处理方法第30-33页
    3.4 建立模型和索引第33-34页
        3.4.1 信息获取模型第33-34页
        3.4.2 倒排文件索引第34页
    3.5 小结第34-35页
第四章 搜索过程和搜索结果排序第35-39页
    4.1 搜索过程第35页
    4.2 搜索结果排序方法第35-36页
    4.3 PageRank算法介绍第36-37页
    4.4 HITS算法介绍第37-38页
    4.5 小结第38-39页
第五章 搜索引擎的设计与实现第39-46页
    5.1 搜索引擎系统结构第39-40页
    5.2 爬行器的设计与实现第40-41页
    5.3 解析器和索引器的设计与实现第41-42页
    5.4 搜索和结果排序的设计与实现第42-43页
    5.5 数据访问对象第43-44页
    5.6 系统实现平台第44-46页
        5.6.1 系统实现平台第44页
        5.6.2 运行结果第44-46页
第六章 结束语第46-48页
    6.1 结论第46页
    6.2 今后工作的展望第46-48页
参考文献第48-49页
致 谢第49-50页
中文摘要第50-53页
Abstract第53页

论文共55页,点击 下载论文
上一篇:微波结合碱解预处理改善剩余污泥厌氧消化效能的研究
下一篇:素域F2上的遍历矩阵及其在密码学中的应用