首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于后缀树聚类算法的元搜索引擎的设计与实现

摘要第4-6页
Abstract第6-7页
第1章 绪论第12-15页
    1.1 研究背景第12-13页
    1.2 工作内容第13-14页
    1.3 论文组织结构第14-15页
第2章 相关技术概念第15-24页
    2.1 搜索引擎第15-20页
        2.1.1 搜索引擎评价指标第15页
        2.1.2 搜索引擎分类第15-18页
        2.1.3 元搜索引擎模块第18-19页
        2.1.4 元搜索引擎的发展方向第19-20页
    2.2 文本聚类算法第20-23页
        2.2.1 文本聚类的概念第20页
        2.2.2 文本聚类的评价标准第20-21页
        2.2.3 文本聚类的主要算法第21-22页
            2.2.3.1 基于层次的方法第21页
            2.2.3.2 基于划分的方法第21-22页
            2.2.3.3 基于网格的方法第22页
            2.2.3.4 基于神经网络的方法第22页
        2.2.4 聚类算法的发展方向第22-23页
    2.3 小结第23-24页
第3章 基于后缀树的元搜索引擎的设计与实现第24-48页
    3.1 系统架构第24-25页
    3.2 用户界面第25-26页
    3.3 检索接口代理第26-27页
    3.4 预处理模块第27-31页
        3.4.1 中文分词第27-29页
        3.4.2 去停用词第29-30页
        3.4.3 倒排索引第30-31页
    3.5 后缀树聚类模块第31-36页
        3.5.1 接口设计第31页
        3.5.2 后缀树的概念第31-32页
        3.5.3 后缀树的构建第32-35页
        3.5.4 后缀树聚类算法的优点第35页
        3.5.5 类簇的合并第35-36页
    3.6 标签生成模块第36-40页
        3.6.1 TF-IDF算法第37页
        3.6.2 针对中文的标签评分第37页
        3.6.3 中文词性分析第37-39页
        3.6.4 标签权值计算公式第39页
        3.6.5 根据标签进行二次合并第39-40页
    3.7 类簇过滤重分模块第40-45页
        3.7.1 无意义标签产生的原因分析第41-42页
        3.7.2 基于中文的启发式过滤规则第42-43页
        3.7.3 过滤重分算法第43-45页
    3.8 结果处理模块第45-47页
        3.8.1 排序第45-46页
        3.8.2 融合和还原第46-47页
    3.9 本章小结第47-48页
第4章 系统测试第48-55页
    4.1 实验环境第48页
    4.2 测试第48-53页
        4.2.1 聚类算法响应时间:第48-50页
        4.2.2 类簇覆盖率第50-51页
        4.2.3 标签可读性第51-53页
    4.3 系统性能分析第53-54页
    4.4 系统改进构想第54-55页
第5章 结论第55-56页
参考文献第56-58页
作者简介第58-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:深圳市宝安区基本公共文化服务创新研究
下一篇:我国内幕交易民事赔偿制度研究