首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网络信息文本挖掘若干问题研究

摘要第5-7页
Abstract第7-8页
第1章 绪论第15-31页
    1.1 课题研究背景第15-17页
    1.2 问题描述第17-18页
    1.3 相关研究发展与现状第18-27页
        1.3.1 文本表示的研究发展与现状第18-21页
        1.3.2 文本聚类算法的研究发展与现状第21-23页
        1.3.3 半监督分类算法的研究发展与现状第23-25页
        1.3.4 不均衡语料下文本分类算法的研究发展与现状第25-27页
    1.4 本文主要工作和意义第27-29页
        1.4.1 本文的主要工作第27-28页
        1.4.2 本文研究工作的意义第28-29页
    1.5 本文组织结构第29-31页
第2章 基于特征聚簇的文本聚类第31-51页
    2.1 引言第31-33页
    2.2 Skip-gram和CBOW模型概述第33-34页
    2.3 非连续短语的识别第34-36页
        2.3.1 定义第35页
        2.3.2 非连续短语识别第35-36页
    2.4 基于特征聚簇的向量空间模型第36-39页
        2.4.1 FC-VSM模型第37-38页
        2.4.2 聚类过程第38-39页
    2.5 实验与分析第39-49页
        2.5.1 文本聚类的评价方法第39-43页
        2.5.2 实验条件与实验语料第43-44页
        2.5.3 聚类效果实验及对比第44-46页
        2.5.4 时间开销实验及对比第46-49页
        2.5.5 降维效果对比第49页
    2.6 小结第49-51页
第3章 基于相似度矩阵的K-means算法第51-63页
    3.1 引言第51页
    3.2 K-means算法第51-53页
    3.3 文本相似性的度量第53-56页
    3.4 基于相似度矩阵的K-means算法第56-58页
    3.5 实验与分析第58-61页
    3.6 小结第61-63页
第4章 基于聚类的非平衡语料混合加权KNN分类算法第63-83页
    4.1 引言第63-64页
    4.2 KNN算法简介第64-65页
    4.3 混合加权KNN算法第65-69页
        4.3.1 样本权重分配第66-67页
        4.3.2 混合加权KNN分类算法第67-69页
    4.4 基于聚类的训练第69-71页
    4.5 实验及结果分析第71-82页
        4.5.1 不平衡数据集分类问题的评价准则第71-74页
        4.5.2 不同数量语料下分类的F值对比分析第74-75页
        4.5.3 标注的F值对比分析第75-77页
        4.5.4 分类F值对比分析第77-79页
        4.5.5 时间开销对比分析第79-82页
    4.6 小结第82-83页
第5章 分布式文本挖掘系统第83-99页
    5.1 引言第83页
    5.2 MapReduce编程模型第83-84页
    5.3 K-means算法的并行化第84-86页
    5.4 KNN算法的并行化第86-88页
    5.5 功能集成与系统框架第88-92页
        5.5.1 系统架构第88-91页
        5.5.2 系统功能第91页
        5.5.3 系统处理流程第91-92页
    5.6 实验第92-98页
        5.6.1 系统环境部署第92页
        5.6.2 聚类性能实验结果与分析第92-93页
        5.6.3 分类性能实验结果与分析第93-95页
        5.6.4 聚类时间开销对比分析第95-96页
        5.6.5 分类时间开销对比分析第96-98页
    5.7 小结第98-99页
第6章 总结与展望第99-103页
    6.1 工作总结第99-100页
    6.2 工作展望第100-103页
参考文献第103-117页
附录:缩略语第117-121页
攻读学位期间发表论文与研究成果清单第121-123页
致谢第123-125页
作者简介第125页

论文共125页,点击 下载论文
上一篇:“数字学校”支持乡村小规模学校的路径研究
下一篇:GhWRI1蛋白结构及功能的研究