首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于主题搜索引擎的文本聚类分类研究与实现

摘要第4-5页
ABSTRACT第5-6页
目录第7-9页
第一章 绪论第9-13页
    1.1 研究背景和意义第9-10页
    1.2 国内外现状第10-11页
    1.3 本文的主要工作第11-12页
    1.4 本文的组织结构第12-13页
第二章 文本分类聚类相关技术研究分析第13-24页
    2.1 文本表示模型第13-16页
        2.1.1 布尔模型第13-14页
        2.1.2 向量空间模型第14页
        2.1.3 概率模型第14-15页
        2.1.4 文中采用的模型第15-16页
    2.2 文本特征选择第16-18页
        2.2.1 文档频率(DF)第16页
        2.2.2 信息增益(IG)第16-17页
        2.2.3 互信息(MI)第17页
        2.2.5 单词权(TS)第17-18页
        2.2.6 几个特征选择对比第18页
    2.3 分类算法第18-21页
        2.3.1 决策树第18-19页
        2.3.2 朴素贝叶斯第19页
        2.3.3 支持向量机第19-20页
        2.3.4 文中采用的分类算法第20-21页
    2.4 聚类算法第21-22页
        2.4.1 K均值算法第21页
        2.4.2 层次聚类第21-22页
        2.4.3 基于密度的DBSCAN算法第22页
        2.4.4 文中采用的聚类算法第22页
    2.5 本章小结第22-24页
第三章 主题搜索引擎的文本分类第24-35页
    3.1 基于招标主题搜索引擎的标题文本特点第24-25页
    3.2 基于LDA模型的分类算法第25-30页
        3.2.1 LDA模型第26-27页
        3.2.2 抽取算法第27-28页
        3.2.3 改进的特征选择第28-30页
    3.3 主题搜索引擎的标题文本分类实验第30-34页
        3.3.1 实验步骤第30-31页
        3.3.2 评价标准第31-32页
        3.3.3 实验结果与分析第32-34页
    3.4 本章小结第34-35页
第四章 主题搜索引擎的文本聚类第35-46页
    4.1 k均值算法的局限性第35-37页
    4.2 改进的k均值聚类算法第37-41页
        4.2.1 优质初始质心的特点第38-39页
        4.2.2 在特征矩阵上选取初始质心第39-41页
    4.3 招标主题搜索引擎的文本聚类实验第41-45页
        4.3.1 评价标准第42页
        4.3.2 实验结果与分析第42-45页
    4.4 本章小结第45-46页
第五章 招标领域主题搜索引擎系统的实现第46-57页
    5.1 系统整体介绍第46-48页
    5.2 重点模块介绍第48-53页
        5.2.1 行业分类模块第48-49页
        5.2.2 地域分类模块第49-50页
        5.2.3 正文属性信息抽取模块第50-53页
    5.3 系统运行结果展示第53-56页
    5.4 本章小结第56-57页
第六章 总结和展望第57-59页
    6.1 全文总结第57-58页
    6.2 不足和展望第58-59页
参考文献第59-63页
致谢第63-64页
攻读学位期间发表的学术论文目录第64页

论文共64页,点击 下载论文
上一篇:神经元NMDA损伤:脑片及神经元模型、药物保护作用及信号转导特点
下一篇:国内公路快运产品营销策略研究--以天地华宇“定日达”为例