首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

大规模垂直搜索方法的研究与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 引言第12-16页
    1.1 论文背景及意义第12-13页
    1.2 研究现状第13-14页
    1.3 论文研究内容第14-15页
    1.4 论文组织结构第15-16页
2 信息获取技术第16-28页
    2.1 搜索引擎第16-19页
        2.1.1 搜索引擎发展第16页
        2.1.2 搜索引擎第16-18页
        2.1.3 搜索引擎的局限性第18-19页
        2.1.4 垂直搜索引擎第19页
    2.2 网络信息获取第19-22页
        2.2.1 通用网络爬虫第19-21页
        2.2.2 主题爬虫第21-22页
    2.3 网页信息预处理第22-25页
        2.3.1 去噪第22-23页
        2.3.2 中文分词第23-25页
    2.4 主题相似度第25-26页
    2.5 本章小结第26-28页
3 主题判别算法第28-48页
    3.1 预处理第28-33页
        3.1.1 网页标准化第28-29页
        3.1.2 DOM树构建第29-31页
        3.1.3 网页文本提取第31页
        3.1.4 基于标签加权的特征词提取第31-33页
    3.2 特征选择第33-35页
    3.3 文本分类第35-38页
        3.3.1 朴素贝叶斯算法第36页
        3.3.2 K邻近算法第36-37页
        3.3.3 决策树算法第37-38页
    3.4 改进的主题判别算法第38-44页
        3.4.1 朴素贝叶斯分类器原理第38-41页
        3.4.2 基于网页特征加权的主题判别算法第41-44页
    3.5 实验分析第44-47页
        3.5.1 判别标准第44页
        3.5.2 实验及结果分析第44-47页
    3.6 本章小结第47-48页
4 基于块提取的链接价值评估方法第48-62页
    4.1 Web网页链接分析第48-49页
    4.2 网页特性第49-56页
        4.2.1 两种类型页面特性第49-51页
        4.2.2 主题网页分布特性第51-53页
        4.2.3 网页分块算法第53-56页
    4.3 搜索策略第56-59页
        4.3.1 基于网页内容分析的搜索策略第57页
        4.3.2 基于链接结构的搜索策略第57-59页
    4.4 基于块提取的链接价值评估算法第59-61页
    4.5 本章小结第61-62页
5 系统设计及实验分析第62-74页
    5.1 系统设计第62-67页
        5.1.1 开发及运行环境第62-63页
        5.1.2 模块设计第63-64页
        5.1.3 流程设计第64-66页
        5.1.4 运行架构设计第66-67页
    5.2 实验结果与分析第67-72页
        5.2.1 实验数据第67-68页
        5.2.2 实验过程第68-69页
        5.2.3 结果与分析第69-72页
    5.3 本章小结第72-74页
6 总结与展望第74-76页
    6.1 论文总结第74页
    6.2 研究展望第74-76页
参考文献第76-79页
作者简历及攻读硕士学位期间取得的研究成果第79-81页
学位论文数据集第81页

论文共81页,点击 下载论文
上一篇:基于改进SVD和迁移学习的矩阵分解推荐算法研究
下一篇:基于变分法的光场深度流估计