摘要 | 第1-6页 |
Abstract | 第6-11页 |
第1章 绪论 | 第11-17页 |
·课题的研究背景 | 第11-12页 |
·课题的研究意义 | 第12-13页 |
·理论意义 | 第12-13页 |
·现实意义 | 第13页 |
·国内外发展现状 | 第13-15页 |
·Blog挖掘 | 第13-14页 |
·情感分析 | 第14-15页 |
·本文的主要工作 | 第15-16页 |
·论文组织结构 | 第16-17页 |
第2章 相关理论与技术 | 第17-37页 |
·网络爬虫技术 | 第17页 |
·中文分词技术 | 第17-23页 |
·最大匹配方法 | 第18-19页 |
·最大概率方法 | 第19-20页 |
·基于矩阵约束法的中文分词方法 | 第20-22页 |
·基于EM算法的中文自动分词方法 | 第22页 |
·基于改进BP网络的中文分词方法 | 第22-23页 |
·情感极性的计算 | 第23-25页 |
·词或短语层次的情感计算 | 第23-24页 |
·句子层次的情感计算 | 第24页 |
·文档层次的情感计算 | 第24-25页 |
·文本的表示方法 | 第25-28页 |
·布尔模型 | 第25-26页 |
·向量空间模型 | 第26页 |
·基于图的文本表示法 | 第26-27页 |
·潜在语义检索 | 第27-28页 |
·文本相似性度量方法 | 第28-31页 |
·基于向量表示的文本相似性度量 | 第28-29页 |
·基于图模型的文本相似性度量 | 第29-31页 |
·聚类技术 | 第31-36页 |
·划分方法 | 第31-33页 |
·层次方法 | 第33-35页 |
·基于密度的方法 | 第35页 |
·基于网格的方法 | 第35页 |
·基于模型的方法 | 第35-36页 |
·本章小结 | 第36-37页 |
第3章 相关聚类分析模型的建立 | 第37-52页 |
·数据的获取 | 第37-41页 |
·Google Blog Search简介 | 第38-39页 |
·Google Blog Search Crawler | 第39-41页 |
·手工标注 | 第41-42页 |
·数据预处理 | 第42-44页 |
·分词 | 第42-43页 |
·提取情感词 | 第43-44页 |
·文本表示 | 第44-45页 |
·基于情感极性的文本聚类 | 第45-46页 |
·聚类结果的表示与评价 | 第46-51页 |
·聚类结果的表示 | 第46-48页 |
·聚类结果的评价 | 第48-51页 |
·本章小结 | 第51-52页 |
第4章 整合的基于图的文本表示模型 | 第52-61页 |
·博客情感图(SOB-GRAPH)的文本表示模型 | 第52-53页 |
·基于博客情感图(SOB-GRAPH)的聚类算法 | 第53-55页 |
·情感极性的细分 | 第55-56页 |
·词语语义相似度计算 | 第56-60页 |
·词语的相似度定义 | 第56页 |
·词语相似度计算方法 | 第56-57页 |
·基于知网的相似度计算方法 | 第57-60页 |
·本章小结 | 第60-61页 |
第5章 实验 | 第61-69页 |
·实验设置 | 第61页 |
·实验步骤 | 第61-62页 |
·实验数据 | 第62-63页 |
·聚类结果的表示 | 第63-65页 |
·"建国大业"聚类结果的表示 | 第64页 |
·"刘翔"聚类结果的表示 | 第64-65页 |
·性能比较和实验结果的分析 | 第65-68页 |
·本章小结 | 第68-69页 |
第6章 总结与展望 | 第69-71页 |
·总结 | 第69-70页 |
·展望 | 第70-71页 |
致谢 | 第71-72页 |
参考文献 | 第72-76页 |
攻读硕士学位期间发表的论文和参研项目情况 | 第76页 |