摘要 | 第3-4页 |
Abstract | 第4-5页 |
引言 | 第9-10页 |
1 绪论 | 第10-16页 |
1.1 研究背景与意义 | 第10-12页 |
1.2 国内外研究现状 | 第12-13页 |
1.2.1 国外研究现状 | 第12-13页 |
1.2.2 国内研究现状 | 第13页 |
1.3 论文的研究内容 | 第13-14页 |
1.4 论文结构 | 第14-16页 |
2 自动摘要概况和私人微博文本特性分析 | 第16-22页 |
2.1 自动文摘意义 | 第16页 |
2.2 几种主要的自动文摘方法 | 第16-19页 |
2.2.1 自动摘录 | 第16-17页 |
2.2.2 基于理解的自动文摘方法 | 第17页 |
2.2.3 信息抽取 | 第17-18页 |
2.2.4 基于结构的自动文摘方法 | 第18页 |
2.2.5 自动文摘处理基本流程结构 | 第18-19页 |
2.2.6 自动文摘基本流程 | 第19页 |
2.3 私人微博文本特征分析 | 第19-21页 |
2.4 本章小结 | 第21-22页 |
3 针对私人微博改进的K-means聚类算法过程 | 第22-29页 |
3.1 聚类算法思想 | 第22-24页 |
3.1.1 层次聚类 | 第22-23页 |
3.1.2 密度聚类 | 第23页 |
3.1.3 网格聚类 | 第23页 |
3.1.4 K-means聚类 | 第23-24页 |
3.1.5 K-modes聚类 | 第24页 |
3.2 改进后的K-means算法 | 第24-27页 |
3.2.1 聚类初始化 | 第24-25页 |
3.2.2 初始类别的选取和中心点的确定 | 第25-26页 |
3.2.3 采用K-means算法进行迭代得出聚类结果 | 第26页 |
3.2.4 聚类结果的整理 | 第26页 |
3.2.5 改进后的K-means算法流程图 | 第26-27页 |
3.3 改进后聚类算法的代码实现 | 第27-28页 |
3.4 本章小结 | 第28-29页 |
4 论文相关工作和课题实现方案 | 第29-38页 |
4.1 源数据的获取 | 第29-32页 |
4.2 数据预处理 | 第32页 |
4.3 文本表示和特征选择 | 第32-35页 |
4.4 相似度计算 | 第35-36页 |
4.5 形成简单摘要 | 第36-37页 |
4.6 本章小结 | 第37-38页 |
5 实验结果和验证 | 第38-45页 |
5.1 实验测试 | 第38页 |
5.2 实验数据 | 第38-41页 |
5.3 试验数据评估指标 | 第41-44页 |
5.3.1 获取数据 | 第41页 |
5.3.2 对实验数据预处理分词 | 第41-42页 |
5.3.3 对文档进行聚类 | 第42页 |
5.3.4 形成自动摘要 | 第42-43页 |
5.3.5 实验结果分析 | 第43-44页 |
5.4 本章小结 | 第44-45页 |
结论 | 第45-47页 |
参考文献 | 第47-51页 |
在学研究成果 | 第51-52页 |
致谢 | 第52页 |