首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

文本聚类分析效果评价及文本表示研究

摘要第1-5页
英文摘要第5-10页
图目录第10-12页
表目录第12-13页
第一章 引言第13-19页
   ·文本聚类分析评价及文本表示的研究背景与意义第13-14页
   ·文本聚类分析简介第14-16页
   ·文本聚类分析评价与文本表示的研究现状第16页
   ·论文的主要研究内容第16-17页
   ·论文的组织第17-19页
第二章 文本聚类效果影响因素第19-37页
   ·聚类分析过程简述第19-20页
   ·文本表示模型第20-27页
     ·布尔模型第20-21页
     ·向量空间模型第21-25页
     ·概率检索模型第25-26页
     ·语言模型第26-27页
     ·其他第27页
   ·距离的定义第27-29页
     ·文本与文本相似度的度量第27-28页
     ·文本簇与文本簇之间的相似度度量第28页
     ·文本与文本簇相似度的度量第28-29页
   ·聚类分析算法第29-36页
     ·簇的充要条件第29-30页
     ·Q 聚类与R 聚类第30页
     ·基本算法思想与算法第30-36页
   ·本章小结第36-37页
第三章 文本聚类效果评价指标体系与应用特性第37-47页
   ·文本聚类效果评价概述第37-39页
   ·基于人工判定的指标第39-45页
     ·平均准确率及相关指标第39-41页
     ·基于人工标注类的准确率、召回率与F-Measure 值第41页
     ·基于簇的准确率、召回率与F-Measure 值第41-42页
     ·基于文档的准确率、召回率与F-Measure 值第42-43页
     ·熵第43页
     ·检测代价第43-44页
     ·小结第44-45页
   ·基于目标函数的指标第45-46页
     ·误差平方和第45页
     ·紧致性与分离性效果函数第45-46页
   ·应用文本聚类评价指标第46页
   ·本章小结第46-47页
第四章 文本聚类算法包实现与主要算法的实验分析第47-71页
   ·文本聚类算法包架构第47-48页
   ·文本聚类算法包接口与配置第48-52页
     ·文本解析模块的输入第48页
     ·文本解析模块的输出与聚类分析模块的输入第48-50页
     ·聚类分析模块的输出与聚类评价模块的输入第50页
     ·文本分析模块的配置文件与中间文件第50-51页
     ·聚类分析模块的配置文件第51页
     ·聚类评价模块的配置第51-52页
   ·应用算法包对主要算法进行实验分析第52-68页
     ·语料第52-53页
     ·关于大类现象的实验研究第53-63页
     ·利用凝聚式层次聚类算法进行影响因素分析第63-66页
     ·K-Means 性能分析第66页
     ·主要聚类分析算法效果横向比较第66-68页
   ·本章小结第68-71页
第五章 文本表示模型的探讨第71-83页
   ·关于文本表示的假设第71页
   ·VSM 模型的特点与缺陷第71-73页
   ·引入序关系的相关研究第73-81页
     ·引入序关系通过CUBIC 聚类算法寻找语义单元第73-75页
     ·引入序关系的图表示模型及其验证研究第75-81页
   ·基于大语料统计打破独立性假设的表示模型第81-82页
   ·本章小结第82-83页
第六章 结束语第83-85页
   ·论文工作总结第83页
   ·下一步研究方向第83-85页
参考文献第85-91页
致谢第91-93页
作者简历第93-94页

论文共94页,点击 下载论文
上一篇:宇宙线研究进展综述—太阳物理中的费米加速机制
下一篇:转反义LeEIL2基因番茄植株鉴定及采后生理特性的研究