摘要 | 第1-4页 |
Abstract | 第4-10页 |
第一章 引言 | 第10-18页 |
·研究背景 | 第10-11页 |
·研究目的 | 第11-12页 |
·研究意义 | 第12-13页 |
·问题的提出 | 第13-14页 |
·研究内容及创新点 | 第14-15页 |
·研究内容 | 第14页 |
·研究创新点 | 第14-15页 |
·论文组织框架 | 第15-17页 |
·本章小结 | 第17-18页 |
第二章 文本聚类概述与研究 | 第18-42页 |
·文本聚类的定义及基本思想 | 第18-22页 |
·文本聚类的定义 | 第18-19页 |
·文本聚类的基本思想及过程 | 第19-22页 |
·热点发现技术中文本聚类方法的国内外研究现状 | 第22-25页 |
·国内研究现状及主要成果 | 第22-23页 |
·国外研究现状及主要成果 | 第23-24页 |
·研究总结 | 第24-25页 |
·文本表示模型 | 第25-36页 |
·布尔模型 | 第26页 |
·向量空间模型 | 第26-34页 |
·N-gram 模型 | 第34-35页 |
·潜性语义索引模型 | 第35-36页 |
·文本聚类方法 | 第36-41页 |
·k-means 聚类算法 | 第36-39页 |
·Hierarchical clusterer 聚类算法 | 第39-40页 |
·DBScan 聚类算法 | 第40-41页 |
·小结 | 第41-42页 |
第三章 热点发现中热度评价概述与研究 | 第42-49页 |
·热点定义及基本思想 | 第42-44页 |
·热点的定义 | 第42页 |
·互联网热点信息的生命周期及特征 | 第42-43页 |
·热点挖掘的定义 | 第43-44页 |
·热度计算及属性特点 | 第44页 |
·热度评价模型及热点发现 | 第44-45页 |
·国内外研究现状及研究成果 | 第45-47页 |
·国内研究现状及成果 | 第45-47页 |
·国外研究现状及成果 | 第47页 |
·小结 | 第47-49页 |
第四章 基于金融领域的本体库 | 第49-63页 |
·本体概述 | 第49-51页 |
·本体及本体库定义 | 第49-50页 |
·本体的体系结构、表现形式及类型 | 第50-51页 |
·常用本体系统介绍 | 第51-54页 |
·WordNet | 第52-53页 |
·OpenCyc | 第53-54页 |
·其他常用本体系统 | 第54页 |
·通用基础本体库的选择 | 第54-56页 |
·WordNet 与 OpenCyc 比较 | 第54-55页 |
·本体库的选取 | 第55-56页 |
·基于金融本体库的构建思路及存在形式 | 第56-58页 |
·本体库在论文研究中的支撑作用 | 第58-61页 |
·小结 | 第61-63页 |
第五章 一种改进的热点发现中的文本聚类方法 | 第63-80页 |
·现有热点发现中文本聚类方法研究的不足 | 第63-64页 |
·引入金融本体库的必要性 | 第64页 |
·热点发现中的文本聚类方法的改进 | 第64-71页 |
·算法一 替代策略 | 第66页 |
·算法二 消歧策略 | 第66-69页 |
·算法三 合并同义词策略 | 第69-70页 |
·算法四 概念特征项的权值计算方法 | 第70-71页 |
·基于金融本体库的文本向量空间模型的生成 | 第71-78页 |
·文本表示模型 | 第73页 |
·文本预处理 | 第73-74页 |
·权值计算及特征选择 | 第74-75页 |
·形成基于词形的向量空间模型 | 第75页 |
·基于概念和词形混合的文本表示 | 第75-76页 |
·二次文本预处理 | 第76页 |
·消除歧义项并合并同义项 | 第76-77页 |
·基于概念和词形的混合特征项的权值计算及二次特征选择 | 第77页 |
·形成基于语义的向量空间模型 | 第77页 |
·文本聚类所用的聚类算法 | 第77-78页 |
·聚类评估及热点发现 | 第78页 |
·基于概念和词形的混合型文本表示模型的优点 | 第78-79页 |
·小结 | 第79-80页 |
第六章 热度评价模型的构建 | 第80-87页 |
·已有热度评价模型不足 | 第80-81页 |
·热度评价模型构建思路 | 第81-84页 |
·热点定义及热点特征重述 | 第81页 |
·热度属性 | 第81-82页 |
·模型构建思路 | 第82-84页 |
·热度评价模型的构建 | 第84-86页 |
·热度属性的形式化描述 | 第84页 |
·热度评价模型 | 第84-86页 |
·小结 | 第86-87页 |
第七章 论文实验比较与分析 | 第87-102页 |
·实验工具选择 | 第87-90页 |
·基于 java 的数据挖掘软件 weka | 第87-89页 |
·访问 WordNet 的开源程序包 JWNL | 第89-90页 |
·实验环境及工具 | 第90页 |
·实验数据准备 | 第90-92页 |
·20-newsgroups | 第90-91页 |
·历史模拟数据 | 第91-92页 |
·实验设计及评估指标 | 第92-94页 |
·基于语义的混合型文本表示模型研究实验设计及评估指标 | 第92-94页 |
·基于金融本体库的热点发现研究的实验设计及评估方法 | 第94页 |
·实验结果分析及结论 | 第94-101页 |
·基于语义的混合型文本表示模型研究实验结果及分析 | 第94-98页 |
·基于金融本体库的热点发现研究的实验结果及分析 | 第98-101页 |
·小结 | 第101-102页 |
第八章 论文总结与展望 | 第102-104页 |
·论文总结 | 第102页 |
·论文研究的不足及下一步研究 | 第102-104页 |
参考文献 | 第104-107页 |
附录 A | 第107-109页 |
在学校期间发表的学术论文与研究成果 | 第109-110页 |
致谢 | 第110页 |