首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

校园对象搜索系统及实体分析和短文本聚类的研究和实现

摘要第4-5页
ABSTRACT第5-6页
目录第7-9页
第一章 绪论第9-13页
    1.1 课题背景第9页
    1.2 研究现状第9-11页
        1.2.1 实体搜索现状第9-10页
        1.2.2 垂直搜索现状第10-11页
    1.3 研究内容第11页
    1.4 论文结构第11-13页
第二章 校园对象搜索系统的任务分析与架构设计第13-18页
    2.1 校园对象搜索系统的研究任务和研究目标第13页
    2.2 数据来源的分析与设定第13-14页
    2.3 基于整合数据的特色功能设计第14-15页
    2.4 功能实现的技术方案分析第15-16页
    2.5 系统架构设计与模块划分第16-18页
第三章 垂直搜索技术在系统中的设计与实现第18-31页
    3.1 数据采集部分第18-23页
        3.1.1 数据获取方式第18-20页
        3.1.2 系统爬虫抓取策略第20-21页
        3.1.3 系统爬虫更新策略第21-22页
        3.1.4 系统爬虫主题过滤策略第22-23页
    3.2 数据加工部分第23-28页
        3.2.1 网页信息结构化模块第24-26页
        3.2.2 预处理与在线服务的分词模块第26页
        3.2.3 索引库的建立与更新策略第26-28页
    3.3 数据检索部分第28-31页
        3.3.1 向量空间模型和概率检索模型第28-29页
        3.3.2 本系统检索部分的模块设计第29-31页
第四章 实体分析技术在系统中的研究与实现第31-44页
    4.1 实体属性信息的抽取模块第31-38页
        4.1.1 半结构化网页的信息抽取技术第32-33页
        4.1.2 老师名片和活动日历功能的信息抽取算法研究与应用第33-38页
    4.2 实体之间的关系挖掘模块第38-44页
        4.2.1 用户之间相似度算法研究与实现第39-40页
        4.2.2 用户权威度的算法研究与实现第40-44页
第五章 短文本聚类技术在系统中的研究与实现第44-53页
    5.1 主题词检测和亲近词挖掘算法的实现第44-48页
        5.1.1 数据预处理第44-45页
        5.1.2 主题词检测第45页
        5.1.3 亲近词挖掘第45-46页
        5.1.4 算法实现与实验分析第46-48页
    5.2 基于LDA模型的短文本聚类技术的应用第48-53页
        5.2.1 LDA模型的生成过程第49-51页
        5.2.2 数据清洗和特征选择第51页
        5.2.3 模型训练与实验分析第51-53页
第六章 校园对象搜索系统的工程实现与成果展示第53-59页
    6.1 系统整体架构的实现第53-54页
    6.2 系统开发采用的开源工具介绍第54-55页
    6.3 系统基础性部分的成果展示第55-56页
    6.4 系统扩展性部分的成果展示第56-59页
第七章 总结与展望第59-61页
    7.1 总结第59页
    7.2 展望第59-61页
参考文献第61-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:基于循环平稳的信号调制方式识别技术研究
下一篇:推荐算法研究和对象搜索引擎的搭建