基于Hadoop的领域知识库自动构建关键技术研究

摘要	第1-5页
Abstract	第5-10页
第1章绪论	第10-16页
·研究背景和意义	第10-11页
·国内外研究现状	第11页
·本文主要工作	第11-14页
·兴趣领域选择	第12-13页
·构建领域知识库方案	第13-14页
·论文内容框架	第14-15页
·本章小结	第15-16页
第2章文本挖掘与相关语义技术	第16-23页
·文本挖掘	第16页
·基于文本内容挖掘	第16页
·基于文本结构挖掘	第16-17页
·信息检索模型	第17-18页
·布尔模型	第17页
·向量空间模型	第17页
·概率模型	第17-18页
·各模型的适用性对比	第18页
·语义技术	第18-20页
·潜在语义分析	第19页
·外部语义分析	第19-20页
·Hadoop	第20-22页
·Hadoop平台的架构	第20-21页
·HDFS	第21-22页
·SSH	第22-23页
第3章串行文本聚类	第23-37页
·文本聚类的一般步骤	第23-28页
·语料库	第23-25页
·分词	第25页
·词性过滤与去停用词处理	第25-26页
·特征提取	第26页
·文本相似度计算	第26-27页
·聚类分析	第27页
·聚类评价	第27-28页
·串行聚类实现	第28-36页
·构建文本相似度矩阵	第28-29页
·K-means算法	第29页
·Normalized Cuts算法	第29-31页
·实验	第31-36页
·本章小结	第36-37页
第4章语义降维	第37-44页
·知网	第37-39页
·基于知网的同义词合并	第39页
·结合领域知识的知网语义加权算法	第39-40页
·实验结果与分析	第40-43页
·本章小结	第43-44页
第5章并行文本聚类	第44-55页
·并行化构建文本向量	第44-47页
·并行矩阵相似度计算	第47-48页
·并行矩阵相乘	第48-49页
·并行数据划分	第49页
·实验	第49-54页
·本章小结	第54-55页
第6章系统实现	第55-58页
·系统功能	第55页
·系统设计	第55-56页
·系统实现	第56-57页
·本章小结	第57-58页
第7章总结与展望	第58-59页
参考文献	第59-62页
致谢	第62-63页
攻读硕士学位期间的研究成果	第63-64页