首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于标签词抽取的搜索结果聚类研究

摘要第1-5页
ABSTRACT第5-8页
第一章 绪论第8-13页
   ·研究背景及意义第8-9页
   ·国内外研究现状第9-11页
     ·文本挖掘定义第9-10页
     ·研究现状第10-11页
   ·论文工作内容及组织结构第11-13页
第二章 相关基础理论第13-31页
   ·中文文档处理技术第13-17页
     ·预处理的流程第13-14页
     ·中文分词第14-15页
     ·停用词处理第15-17页
     ·背景噪声过滤第17页
   ·支持向量回归理论第17-21页
     ·SVR基本思想第18页
     ·SVR简介第18-21页
   ·文本表示模型第21-23页
     ·向量空间模型第21-22页
     ·语义空间模型第22-23页
   ·文本相似度计算第23-25页
     ·文档相似度第23-24页
     ·文档相异度第24页
     ·簇和簇之间的邻近性度量第24-25页
   ·文本聚类概述第25-29页
     ·文本聚类概述第25-27页
     ·主要的聚类算法简介第27-29页
     ·文本挖掘对聚类的要求第29页
   ·本章小结第29-31页
第三章 基于标签词的Web文档聚类第31-41页
   ·语料预处理第31-35页
     ·网页去噪第31-33页
     ·分词第33页
     ·求3元模型词第33-34页
     ·停用词表第34页
     ·对候选词的人工标注第34-35页
   ·标签词抽取第35-39页
     ·特征选取第35-37页
     ·基于监督模型的打分方法第37页
     ·标签词的后期处理第37-39页
   ·基于标签词的层次聚类第39-40页
   ·本章小结第40-41页
第四章 系统的设计与实现第41-46页
   ·系统的概述第41页
   ·语料收集模块第41-42页
   ·预处理模块第42-44页
   ·模型训练和聚类模块第44-45页
   ·本章小结第45-46页
第五章 实验结果与分析第46-51页
   ·实验设计第46页
     ·实验内容第46页
     ·实验环境和数据集第46页
   ·标签词抽取第46-47页
   ·支持向量回归统计第47-48页
     ·支持向量回归统计结果第48页
     ·结果分析第48页
   ·标签词的聚类第48-50页
     ·标签词的聚类结果第48-49页
     ·聚类结果分析第49-50页
   ·本章小结第50-51页
第六章 总结与展望第51-52页
参考文献第52-58页
致谢第58-59页
作者攻读学位期间发表的学术论文目录第59页

论文共59页,点击 下载论文
上一篇:基于J2EE的混合式学习课程制作系统的研究与实现
下一篇:Web结构挖掘算法的改进研究