短语消息聚类相关技术研究
摘要 | 第1-13页 |
ABSTRACT | 第13-15页 |
第一章 绪论 | 第15-31页 |
·研究背景 | 第15-18页 |
·短语消息聚类需求背景 | 第15-17页 |
·短语消息聚类问题的提出 | 第17-18页 |
·相关工作分析与挑战 | 第18-26页 |
·会话抽取相关工作分析 | 第19-20页 |
·文本模型分析 | 第20-22页 |
·主要聚类算法分析 | 第22-24页 |
·短语消息特征和挑战 | 第24-26页 |
·本文工作 | 第26-29页 |
·研究内容 | 第26-27页 |
·主要工作和创新 | 第27-29页 |
·论文结构 | 第29-30页 |
·术语和符号 | 第30-31页 |
第二章 短语消息聚类系统模型MeCuSyM | 第31-41页 |
·常规文本聚类模型分析 | 第31-32页 |
·短语消息特征分析 | 第32-35页 |
·交错性特征 | 第32-33页 |
·稀疏性特征 | 第33-34页 |
·大规模特征 | 第34-35页 |
·MeCSyM 模型的提出 | 第35-36页 |
·MeCSyM 模型分析 | 第36-39页 |
·会话抽取模块 | 第36-37页 |
·文本表示与相似性度量模块 | 第37-38页 |
·并行聚类处理模块 | 第38-39页 |
·本章小结 | 第39-41页 |
第三章 会话抽取算法DWExter | 第41-57页 |
·短语消息流基本特征 | 第41-43页 |
·内容特征 | 第41页 |
·语法特征 | 第41-42页 |
·时间特征 | 第42-43页 |
·相关技术分析 | 第43-45页 |
·基本算法介绍 | 第43-44页 |
·关键算法分析 | 第44-45页 |
·消息-会话相关性度量 | 第45-48页 |
·消息与会话间相关度定义 | 第45-46页 |
·最大反向相关数据结构RMR | 第46-48页 |
·会话抽取算法DWExter | 第48-51页 |
·DWExter 算法描述 | 第48-50页 |
·算法复杂性分析 | 第50-51页 |
·实验 | 第51-56页 |
·实验设置 | 第51页 |
·评价指标 | 第51-53页 |
·测试数据集 | 第53-54页 |
·实验结果 | 第54-56页 |
·本章小结 | 第56-57页 |
第四章 短文本内容相似性度量算法SiM | 第57-75页 |
·问题描述与相关技术分析 | 第57-60页 |
·问题描述 | 第57-58页 |
·相关技术分析 | 第58-60页 |
·词间关系无向图NRG | 第60-66页 |
·基于词法分类器度量词间关系 | 第60-62页 |
·基于语料集度量词间关系 | 第62-64页 |
·非均衡关键词权重 | 第64-65页 |
·NRG 构建算法CrtNRG | 第65页 |
·基于NRG 的词间关系 | 第65-66页 |
·文本动态表示向量 | 第66-68页 |
·相似性度量算法SiM | 第68-69页 |
·实验 | 第69-74页 |
·实验设置 | 第69-70页 |
·评价指标 | 第70页 |
·测试数据集 | 第70-71页 |
·实验结果 | 第71-74页 |
·本章小结 | 第74-75页 |
第五章 混合聚类算法SHDC 和parSHDC | 第75-99页 |
·基本概念与问题描述 | 第75-78页 |
·基于频繁词集的聚类算法 | 第76-77页 |
·k-means 算法 | 第77-78页 |
·问题描述 | 第78页 |
·相关技术分析 | 第78-80页 |
·基于频繁词集的聚类算法 | 第78-79页 |
·k-means 优化方法 | 第79-80页 |
·基于频繁词集和k-means 的混合聚类算法 | 第80页 |
·混合聚类算法SHDC | 第80-83页 |
·构建初始聚簇 | 第81-82页 |
·SHDC 算法 | 第82-83页 |
·并行聚类算法parSHDC | 第83-89页 |
·MPI | 第83-84页 |
·纵向数据划分策略VDiV | 第84-85页 |
·并行粗聚类算法parROC | 第85-86页 |
·改进的并行k-means 算法OK-means | 第86-87页 |
·并行混合聚类算法parSHDC | 第87-89页 |
·实验 | 第89-97页 |
·实验一 | 第89-93页 |
·实验二 | 第93-97页 |
·本章小结 | 第97-99页 |
第六章 短语消息聚类原型系统设计与实现 | 第99-109页 |
·StarTPMonitor 系统结构 | 第99-100页 |
·StarSTMiner+系统结构 | 第100-102页 |
·总体结构 | 第100-101页 |
·系统平台 | 第101-102页 |
·StarSTMiner+子模块设计与实现 | 第102-108页 |
·数据访问模块 | 第102-103页 |
·预处理模块 | 第103页 |
·NRG 维护模块 | 第103-105页 |
·相似度模块 | 第105页 |
·会话合成模块 | 第105-106页 |
·数据划分模块 | 第106-107页 |
·聚类模块 | 第107页 |
·调度模块 | 第107-108页 |
·本章小结 | 第108-109页 |
结束语 | 第109-113页 |
致谢 | 第113-115页 |
参考文献 | 第115-121页 |
攻读博士学位期间已发表和待发表的论文 | 第121-123页 |
攻读博士学位期间参与的科研项目 | 第123页 |