目录 | 第1-6页 |
图表目录 | 第6-7页 |
摘要 | 第7-9页 |
Abstract | 第9-11页 |
第一章 绪论 | 第11-23页 |
·立论背景 | 第11-12页 |
·文本分类(Text Categorization)介绍 | 第12-17页 |
·问题描述 | 第13-14页 |
·文本分类的特点 | 第14-15页 |
·研究文本分类的意义 | 第15-16页 |
·文本分类的研究现状 | 第16-17页 |
·文本聚类(Text Clustering)介绍 | 第17-21页 |
·聚类和文本聚类 | 第17-19页 |
·聚类方法划分 | 第19页 |
·聚类的研究意义 | 第19-20页 |
·文本聚类的研究现状 | 第20-21页 |
·本文的工作 | 第21-23页 |
·研究内容 | 第21-22页 |
·本文的组织结构 | 第22-23页 |
第二章 文本信息处理相关技术介绍 | 第23-48页 |
·文本信息处理的技术基础 | 第23-30页 |
·文档表示模型 | 第23-24页 |
·切词 | 第24-26页 |
·中文切词的问题 | 第24-25页 |
·中文切词的主要方法 | 第25-26页 |
·文档特征及其选择算法 | 第26-30页 |
·文档特征 | 第26-27页 |
·文档特征选择算法 | 第27-30页 |
·文本分类的方法及性能评估 | 第30-39页 |
·文本分类的主要方法 | 第30-36页 |
·基于统计的方法 | 第30-33页 |
·基于机器学习的方法 | 第33-34页 |
·基于神经网络的算法 | 第34-36页 |
·分类性能评估 | 第36-39页 |
·评估方法 | 第36-37页 |
·评估指标 | 第37-39页 |
·文本聚类度量和算法 | 第39-47页 |
·距离与相似性度量 | 第39-42页 |
·样本距离度量 | 第40页 |
·样本相似性度量 | 第40-41页 |
·类间距离度量 | 第41-42页 |
·文本聚类算法 | 第42-47页 |
·划分法 | 第42-43页 |
·层次法 | 第43-44页 |
·基于密度法 | 第44-45页 |
·基于网格法 | 第45-46页 |
·基于模型法 | 第46-47页 |
·本章总结 | 第47-48页 |
第三章 基于混淆矩阵的层次结构构造方法比较 | 第48-63页 |
·引言 | 第48-51页 |
·混淆矩阵 | 第51-52页 |
·层次结构的构建 | 第52-58页 |
·、使用层次聚类法构建文档类别层次结构 | 第52-56页 |
·个体样本之间的距离度量 | 第53页 |
·类与类之间的距离度量 | 第53-54页 |
·聚类过程和算法 | 第54-56页 |
·使用混淆类别法构建文档类别层次结构 | 第56-58页 |
·层次分类 | 第58-59页 |
·实验结果分析 | 第59-62页 |
·本章总结 | 第62-63页 |
第四章 基于情感色彩的文档流派分类研究 | 第63-80页 |
·引言 | 第63-68页 |
·流派和流派分类 | 第63-64页 |
·研究文档流派分类的意义 | 第64-66页 |
·当前研究进展 | 第66-68页 |
·本章的研究内容和结构 | 第68页 |
·特征词的情感倾向判定 | 第68-77页 |
·连词判定法 | 第68-70页 |
·PMI | 第70-73页 |
·LSA | 第73-74页 |
·词网(WordNet)中的语义距离 | 第74-76页 |
·人工确定情感特征及其情感倾向权值 | 第76-77页 |
·情感分类过程 | 第77-78页 |
·实验 | 第78-79页 |
·本章总结 | 第79-80页 |
第五章 基于小波变换的近似查询处理 | 第80-97页 |
·引言 | 第80-83页 |
·小波变换和近似查询 | 第83-88页 |
·一维Haar小波变换 | 第84-85页 |
·多维Haar小波变换 | 第85-87页 |
·近似查询 | 第87-88页 |
·小波域上的查询处理 | 第88-91页 |
·小波域上的合并(Union) | 第88-90页 |
·小波域上的差(difference) | 第90-91页 |
·小波域上的更新(Update) | 第91-92页 |
·实验结果和分析 | 第92-96页 |
·本章总结 | 第96-97页 |
第六章 总结与展望 | 第97-100页 |
·本文研究成果 | 第97-98页 |
·进一步的工作 | 第98-100页 |
参考文献 | 第100-113页 |
攻读博士学位期间参与的科研项目及主要成果 | 第113-114页 |
致谢 | 第114-115页 |