摘要 | 第1-5页 |
英文摘要 | 第5-10页 |
图目录 | 第10-12页 |
表目录 | 第12-13页 |
第一章 引言 | 第13-19页 |
·文本聚类分析评价及文本表示的研究背景与意义 | 第13-14页 |
·文本聚类分析简介 | 第14-16页 |
·文本聚类分析评价与文本表示的研究现状 | 第16页 |
·论文的主要研究内容 | 第16-17页 |
·论文的组织 | 第17-19页 |
第二章 文本聚类效果影响因素 | 第19-37页 |
·聚类分析过程简述 | 第19-20页 |
·文本表示模型 | 第20-27页 |
·布尔模型 | 第20-21页 |
·向量空间模型 | 第21-25页 |
·概率检索模型 | 第25-26页 |
·语言模型 | 第26-27页 |
·其他 | 第27页 |
·距离的定义 | 第27-29页 |
·文本与文本相似度的度量 | 第27-28页 |
·文本簇与文本簇之间的相似度度量 | 第28页 |
·文本与文本簇相似度的度量 | 第28-29页 |
·聚类分析算法 | 第29-36页 |
·簇的充要条件 | 第29-30页 |
·Q 聚类与R 聚类 | 第30页 |
·基本算法思想与算法 | 第30-36页 |
·本章小结 | 第36-37页 |
第三章 文本聚类效果评价指标体系与应用特性 | 第37-47页 |
·文本聚类效果评价概述 | 第37-39页 |
·基于人工判定的指标 | 第39-45页 |
·平均准确率及相关指标 | 第39-41页 |
·基于人工标注类的准确率、召回率与F-Measure 值 | 第41页 |
·基于簇的准确率、召回率与F-Measure 值 | 第41-42页 |
·基于文档的准确率、召回率与F-Measure 值 | 第42-43页 |
·熵 | 第43页 |
·检测代价 | 第43-44页 |
·小结 | 第44-45页 |
·基于目标函数的指标 | 第45-46页 |
·误差平方和 | 第45页 |
·紧致性与分离性效果函数 | 第45-46页 |
·应用文本聚类评价指标 | 第46页 |
·本章小结 | 第46-47页 |
第四章 文本聚类算法包实现与主要算法的实验分析 | 第47-71页 |
·文本聚类算法包架构 | 第47-48页 |
·文本聚类算法包接口与配置 | 第48-52页 |
·文本解析模块的输入 | 第48页 |
·文本解析模块的输出与聚类分析模块的输入 | 第48-50页 |
·聚类分析模块的输出与聚类评价模块的输入 | 第50页 |
·文本分析模块的配置文件与中间文件 | 第50-51页 |
·聚类分析模块的配置文件 | 第51页 |
·聚类评价模块的配置 | 第51-52页 |
·应用算法包对主要算法进行实验分析 | 第52-68页 |
·语料 | 第52-53页 |
·关于大类现象的实验研究 | 第53-63页 |
·利用凝聚式层次聚类算法进行影响因素分析 | 第63-66页 |
·K-Means 性能分析 | 第66页 |
·主要聚类分析算法效果横向比较 | 第66-68页 |
·本章小结 | 第68-71页 |
第五章 文本表示模型的探讨 | 第71-83页 |
·关于文本表示的假设 | 第71页 |
·VSM 模型的特点与缺陷 | 第71-73页 |
·引入序关系的相关研究 | 第73-81页 |
·引入序关系通过CUBIC 聚类算法寻找语义单元 | 第73-75页 |
·引入序关系的图表示模型及其验证研究 | 第75-81页 |
·基于大语料统计打破独立性假设的表示模型 | 第81-82页 |
·本章小结 | 第82-83页 |
第六章 结束语 | 第83-85页 |
·论文工作总结 | 第83页 |
·下一步研究方向 | 第83-85页 |
参考文献 | 第85-91页 |
致谢 | 第91-93页 |
作者简历 | 第93-94页 |