海量短语信息挖掘技术的研究与实现
| 摘要 | 第1-15页 |
| ABSTRACT | 第15-18页 |
| 第一章 绪论 | 第18-28页 |
| ·课题背景 | 第18-22页 |
| ·信息时代的数据规模 | 第18-19页 |
| ·海量文本挖掘需求 | 第19-22页 |
| ·研究现状 | 第22-26页 |
| ·文本挖掘的相关工作 | 第22-24页 |
| ·海量短语信息挖掘面临的挑战 | 第24-26页 |
| ·本文工作 | 第26-27页 |
| ·论文结构 | 第27-28页 |
| 第二章 海量短文数据库中的频繁词集挖掘 | 第28-46页 |
| ·频繁词集挖掘 | 第28-34页 |
| ·关联规则挖掘和频繁词集 | 第28-30页 |
| ·频繁项集挖掘方法 | 第30-33页 |
| ·频繁词集挖掘面临的挑战 | 第33-34页 |
| ·并行Top-k频繁词集挖掘算法 | 第34-41页 |
| ·问题描述和基础工作 | 第34-36页 |
| ·短词集和重复词集排除 | 第36-38页 |
| ·H-struct裁剪策略 | 第38页 |
| ·数据划分和并行化处理 | 第38-40页 |
| ·parTFT算法 | 第40-41页 |
| ·算法实验研究 | 第41-44页 |
| ·本章小结 | 第44-46页 |
| 第三章 海量短语信息分类 | 第46-64页 |
| ·文本分类 | 第46-51页 |
| ·问题描述 | 第46页 |
| ·向量空间模型和文本特征选择 | 第46-48页 |
| ·基于向量空间模型的文本分类 | 第48-50页 |
| ·基于语义的文本分类 | 第50-51页 |
| ·概念语义空间和信息流 | 第51-54页 |
| ·HAL概念语义空间 | 第51-53页 |
| ·概念组合策略 | 第53-54页 |
| ·基于HAL的信息流计算 | 第54页 |
| ·文本语义特征图 | 第54-57页 |
| ·基于图的语义信息表示 | 第55页 |
| ·基本语义树构建 | 第55-56页 |
| ·优化语义树 | 第56页 |
| ·语义特征图构建 | 第56-57页 |
| ·基于语义的短语信息分类算法 | 第57-60页 |
| ·基于TSFG的KNN方法 | 第57-58页 |
| ·加权最短路径问题 | 第58-59页 |
| ·SDCS算法 | 第59-60页 |
| ·算法分析和实验研究 | 第60-62页 |
| ·准确度度量 | 第60页 |
| ·实验环境和数据集 | 第60页 |
| ·实验方法和结果 | 第60-62页 |
| ·本章小结 | 第62-64页 |
| 第四章 海量短语信息聚类 | 第64-86页 |
| ·短文本聚类 | 第64-67页 |
| ·文本聚类方法 | 第64-66页 |
| ·短文本聚类面临的挑战 | 第66-67页 |
| ·基于频繁词集的短文本聚类 | 第67-71页 |
| ·基本聚类方法和簇的表示 | 第67-69页 |
| ·并行化方法 | 第69页 |
| ·基于语义信息的簇重叠消除 | 第69-70页 |
| ·FTSDC算法 | 第70-71页 |
| ·基于密度的短文本聚类 | 第71-80页 |
| ·基本的密度聚类方法 | 第71-73页 |
| ·基于SNN的密度聚类 | 第73-75页 |
| ·短文本距离计算 | 第75-78页 |
| ·并行化方法 | 第78-80页 |
| ·算法实验研究 | 第80-85页 |
| ·FTSDC算法实验研究 | 第80-82页 |
| ·DSDC算法实验研究 | 第82-85页 |
| ·本章小结 | 第85-86页 |
| 第五章 基于本体论的海量短语信息挖掘 | 第86-108页 |
| ·基于本体论的文本挖掘 | 第86-95页 |
| ·本体论概述 | 第86-88页 |
| ·基于本体论的文本挖掘方法 | 第88-95页 |
| ·短文数据库上的领域本体构建 | 第95-99页 |
| ·本体描述 | 第95-96页 |
| ·形式概念分析 | 第96-97页 |
| ·领域本体构建 | 第97-99页 |
| ·基于领域本体的海量短语信息聚类 | 第99-103页 |
| ·OFSDC的基本思想 | 第99页 |
| ·基于频繁概念集的短文聚类 | 第99-103页 |
| ·基于领域本体和密度的短文聚类 | 第103页 |
| ·算法实验研究 | 第103-107页 |
| ·OFSDC算法实验研究 | 第103-105页 |
| ·ODSDC算法实验研究 | 第105-107页 |
| ·本章小结 | 第107-108页 |
| 第六章 海量短语信息挖掘引擎的设计与实现 | 第108-118页 |
| ·StarTPMonitor系统结构 | 第108-110页 |
| ·StarSTMiner总体设计 | 第110-112页 |
| ·总体结构 | 第110-111页 |
| ·并行化体系结构 | 第111-112页 |
| ·StarSTMiner子模块的设计与实现 | 第112-117页 |
| ·汉语分析模块 | 第112-113页 |
| ·语义信息构建模块 | 第113-114页 |
| ·短文挖掘模块 | 第114-117页 |
| ·本章小结 | 第117-118页 |
| 结束语 | 第118-120页 |
| 致谢 | 第120-121页 |
| 参考文献 | 第121-134页 |
| 作者在学期间取得的学术成果 | 第134-135页 |