首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于向量空间的文本聚类方法与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 引言第11-16页
    1.1 论文背景及意义第11-12页
    1.2 国内外研究现状第12-13页
    1.3 本文主要内容及结构第13-16页
        1.3.1 主要内容第13-14页
        1.3.2 本文组织结构第14-16页
2 文本聚类方法相关技术第16-31页
    2.1 文本聚类第16-17页
    2.2 分词第17-19页
    2.3 文本特征提取第19-20页
    2.4 文本表示模型第20-22页
        2.4.1 向量空间模型第20-21页
        2.4.2 布尔模型第21页
        2.4.3 概率模型第21-22页
    2.5 文本相似度计算第22-24页
        2.5.1 距离度量第22-23页
        2.5.2 相似度度量第23-24页
    2.6 主要聚类算法第24-28页
        2.6.1 划分方法聚类第25页
        2.6.2 层次方法聚类第25-26页
        2.6.3 基于密度方法聚类第26-27页
        2.6.4 基于网格方法聚类第27-28页
    2.7 文本聚类质量评价第28-29页
        2.7.1 外在方法第28-29页
        2.7.2 内在方法第29页
        2.7.3 相对评价方法第29页
    2.8 本章小结第29-31页
3 基于向量空间的文本聚类方法设计第31-44页
    3.1 文本向量化第32-34页
    3.2 语义空间降维第34-40页
        3.2.1 奇异值分解的基本方法第34-35页
        3.2.2 词汇-文本矩阵的奇异值分解第35-37页
        3.2.3 应用SVD进行文本聚类第37-38页
        3.2.4 文本扩充第38-39页
        3.2.5 奇异值计算的复杂性第39-40页
    3.3 文本聚类第40-43页
    3.4 本章小结第43-44页
4 实现与结果讨论第44-57页
    4.1 实验步骤第44页
    4.2 文本集及其向量化第44-50页
        4.2.1 词汇-文本矩阵建立第45-47页
        4.2.2 矩阵分解第47-49页
        4.2.3 向量空间压缩第49-50页
    4.3 聚类过程第50-54页
        4.3.1 参数的设置第50-51页
        4.3.2 单参数指数平滑方法第51-54页
    4.4 实验结果评价第54-56页
    4.5 本章小结第56-57页
5 总结第57-59页
    5.1 论文总结第57-58页
    5.2 展望第58-59页
参考文献第59-61页
附录A第61-62页
作者简历及攻读硕士 /博士学位期间取得的研究成果第62-64页
学位论文数据集第64页

论文共64页,点击 下载论文
上一篇:基于Kinect手势识别的虚拟人体解剖教学系统的设计与实现
下一篇:高职学生社会主义核心价值观认同培养的研究