首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于特征抽取的企业文本数据索引系统的研究和实现

摘要第4-5页
Abstract第5-6页
第一章 绪论第9-15页
    1.1 课题研究背景第9-10页
    1.2 国内外研究现状第10-11页
    1.3 论文研究的目标和内容第11-12页
        1.3.1 研究目标第11页
        1.3.2 研究内容第11-12页
    1.4 论文课题来源和主要贡献第12-13页
        1.4.1 论文课题来源第12-13页
        1.4.2 论文主要贡献第13页
    1.5 论文章节安排第13-15页
第二章 技术背景概述第15-28页
    2.1 文本特征抽取方法介绍第15-18页
        2.1.1 HMM模型第16-17页
        2.1.3 CRF模型第17-18页
        2.1.4 基于规则的抽取第18页
    2.2 SVM分类模型第18-20页
    2.3 搜索引擎中经典排序算法及其比较第20-25页
        2.3.1 PageRank算法第20-21页
        2.3.2 Hits算法第21-22页
        2.3.3 Hilltop算法第22-23页
        2.3.4 经典算法评价第23-25页
    2.4 文本索引技术第25-27页
        2.4.1 Solr简介第25-26页
        2.4.2 Solr索引功能第26-27页
        2.4.3 文本分词方法第27页
    2.5 本章小结第27-28页
第三章 企业文本的特征抽取方法的研究第28-38页
    3.1 企业产品说明文本特点分析第28-29页
    3.2 面向企业文本的特征抽取方法第29-34页
        3.2.1 规则的产生第29-32页
        3.2.2 改进的特征抽取方法第32-34页
    3.3 实验第34-37页
        3.3.1 实验的评估第35页
        3.3.2 实验结果第35-37页
    3.4 本章小结第37-38页
第四章 改进的文本排序算法的研究第38-46页
    4.1 改进的文本排序算法第38-42页
        4.1.1 文本的PageRank值第38-39页
        4.1.2 文本间的相似度第39-40页
        4.1.3 文本的TF-IDF值第40-41页
        4.1.4 改进的文本PageRank值第41-42页
    4.2 文本模型的训练第42-43页
    4.3 实验评估第43-45页
        4.3.1 查询响应时间第43-44页
        4.3.2 查准率第44-45页
    4.4 本章小结第45-46页
第五章 企业文本搜索引擎原型系统及实现第46-69页
    5.1 系统功能概述第46页
    5.2 原型系统的设计第46-50页
        5.2.1 体系结构第46-49页
        5.2.2 系统环境第49-50页
    5.3 系统关键类说明第50-54页
    5.4 原型系统的功能测试第54-66页
        5.4.1 企业文本数据格式的处理第54页
        5.4.2 文本特征抽取第54-56页
        5.4.3 文本间相似度的计算第56-58页
        5.4.4 文本的TF-IDF值的计算第58-60页
        5.4.5 文本的PageRank值的计算第60-62页
        5.4.6 文本训练模型第62-64页
        5.4.7 文本索引的实现第64-66页
    5.5 用户查询测试第66-68页
    5.6 本章小结第68-69页
第六章 总结和展望第69-71页
    6.1 总结第69页
    6.2 展望第69-71页
参考文献第71-75页
附录1 攻读硕士学位期间撰写的论文第75-76页
附录2 攻读硕士学位期间申请的专利第76-77页
附录3 攻读硕士学位期间参加的科研项目第77-78页
致谢第78页

论文共78页,点击 下载论文
上一篇:基于标志位和决策树算法的AVI文件雕刻方法
下一篇:基于Petri网的Web服务组合的分析与验证