首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于C-LDA的教育领域搜索引擎的研究与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 绪论第12-18页
    1.1 研究背景及意义第12-13页
    1.2 国内外研究现状第13-15页
        1.2.1 国外研究现状第13-14页
        1.2.2 国内研究现状第14-15页
    1.3 论文主要工作第15-16页
    1.4 论文组织结构第16-18页
2 相关技术简介第18-32页
    2.1 网络爬虫相关技术第18-22页
        2.1.1 网络爬虫基本原理第18-19页
        2.1.2 网络爬虫的类型第19-20页
        2.1.3 网络爬虫搜索策略第20-22页
    2.2 文本表示模型第22-25页
        2.2.1 向量空间模型第23页
        2.2.2 布尔模型第23-24页
        2.2.3 概率模型第24-25页
    2.3 搜索引擎相关技术第25-28页
        2.3.1 搜索引擎的体系结构第25-26页
        2.3.2 搜索引擎工作原理第26-27页
        2.3.3 搜索引擎评价指标第27-28页
    2.4 经典社区划分算法介绍第28-30页
        2.4.1 凝聚法第28页
        2.4.2 分裂法第28-29页
        2.4.3 谱算法第29页
        2.4.4 BGLL算法第29-30页
    2.5 本章小结第30-32页
3 改进的LDA最优主题个数选取方法(C-LDA)第32-48页
    3.1 引言第32页
    3.2 确定最优主题数第32-35页
        3.2.1 LDA主题模型第33-34页
        3.2.2 主题数重要性分析第34-35页
        3.2.3 最优主题数目选取方法第35页
    3.3 频繁词网络与社区划分第35-38页
        3.3.1 数据预处理第35-37页
        3.3.2 挖掘频繁词集第37页
        3.3.3 构建频繁词网络第37页
        3.3.4 基于模块度的社区划分第37-38页
    3.4 实验结果与分析第38-46页
        3.4.1 实验环境第38页
        3.4.2 实验数据第38-39页
        3.4.3 实验评价指标第39-40页
        3.4.4 实验设计与结果分析第40-46页
    3.5 本章小结第46-48页
4 基于C-LDA的用户兴趣改进模型第48-62页
    4.1 引言第48页
    4.2 基于倒排索引(Lucene)的搜索引擎第48-50页
        4.2.1 Lucene基本原理第49-50页
        4.2.2 分词器第50页
    4.3 融合用户兴趣与Lucene的排序算法改进第50-53页
        4.3.1 用户兴趣重要性分析第51页
        4.3.2 C-LDA主题模型第51-52页
        4.3.3 用户兴趣建模第52页
        4.3.4 UCI-Lucene排序算法第52-53页
    4.4 实验结果与分析第53-61页
        4.4.1 实验环境第53-54页
        4.4.2 实验数据第54-55页
        4.4.3 实验评价指标第55-56页
        4.4.4 实验设计与结果分析第56-61页
    4.5 本章小结第61-62页
5 基于用户兴趣的教育领域搜索引擎的研究与实现第62-80页
    5.1 总体架构第62页
    5.2 分布式爬虫系统的设计与实现第62-71页
        5.2.1 系统架构第62-63页
        5.2.2 控制服务器的设计第63-65页
        5.2.3 控制服务器的实现第65-68页
        5.2.4 爬虫服务器的设计第68-69页
        5.2.5 爬虫服务器的实现第69-71页
    5.3 教育领域搜索引擎的设计与实现第71-74页
        5.3.1 系统架构第71-72页
        5.3.2 索引模块的设计与实现第72-73页
        5.3.3 检索模块的设计与实现第73-74页
        5.3.4 用户兴趣模块的设计与实现第74页
    5.4 系统测试第74-79页
        5.4.1 注册模块测试第74-75页
        5.4.2 登录模块测试第75-77页
        5.4.3 监控模块测试第77-78页
        5.4.4 搜索模块测试第78-79页
    5.5 本章小结第79-80页
6 总结与展望第80-82页
    6.1 总结第80-81页
    6.2 展望第81-82页
参考文献第82-86页
作者简历及攻读硕士期间取得的研究成果第86-90页
学位论文数据集第90页

论文共90页,点击 下载论文
上一篇:文本分析资源与任务管理系统的设计与实现
下一篇:听觉与视觉联合目标跟踪仿生系统的研制