首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于内容与结构的文本挖掘方法及其分布式应用研究

摘要第6-7页
ABSTRACT第7-8页
第一章 绪论第9-14页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究现状第10-12页
        1.2.1 评分算法研究现状第10-11页
        1.2.2 分割算法研究现状第11-12页
    1.3 研究工作与结构安排第12-14页
        1.3.1 研究工作第12页
        1.3.2 内容结构第12-14页
第二章 基于分词距离改进评分算法第14-22页
    2.1 分词距离基本概念第14页
    2.2 数据预处理第14-16页
        2.2.1 抽取关键词第14-15页
        2.2.2 处理查询串第15页
        2.2.3 形式化表达文档第15-16页
    2.3 句子相似度计算模型第16-19页
        2.3.1 标识关键词和查询串第16-17页
        2.3.2 建立句子相似度计算模型第17-19页
        2.3.3 分词距离相似度得分第19页
    2.4 实验第19-21页
        2.4.1 实验数据第19-20页
        2.4.2 实验结果第20-21页
    2.5 本章小结第21-22页
第三章 基于结构的文本分割算法及其应用到的检索模式探究第22-33页
    3.1 文本分割算法基本概念第22-29页
        3.1.1 检测子主题转换第23-25页
        3.1.2 TextTiling算法介绍第25-28页
            3.1.2.1 文本预处理第25页
            3.1.2.2 确定分值第25-26页
            3.1.2.3 边界标识第26-27页
            3.1.2.4 平滑化绘制图第27-28页
        3.1.3 TextTiling算法的优化和改进第28-29页
    3.2 主从检索模式第29-30页
    3.3 考虑子主题结构以改善信息检索第30-32页
        3.3.1 实验数据第30-31页
        3.3.2 实验结果第31-32页
    3.4 本章小结第32-33页
第四章 改进算法在全文检索系统中的应用第33-39页
    4.1 SolrCloud框架分析第33-35页
        4.1.1 搭建单一solr服务第33-34页
        4.1.2 搭建SolrCloud集群第34-35页
    4.2 改进算法的具体应用第35-38页
        4.2.1 基于内容改进的算法应用到Lucene评分算法第35-36页
        4.2.2 基于结构改进的全文检索模式第36-38页
    4.3 本章小结第38-39页
第五章 总结与展望第39-41页
    5.1 工作总结第39-40页
    5.2 工作展望第40-41页
参考文献第41-44页
攻读硕士学位期间取得的科研成果第44-45页
致谢第45页

论文共45页,点击 下载论文
上一篇:基于移动终端纹理防伪标签自动识别系统的设计和实现
下一篇:云计算环境下的平台可信度认证问题研究