首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本挖掘的研究及其在主题搜索引擎中的应用

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-13页
   ·研究背景与意义第10-11页
   ·国内外研究现状第11页
   ·主要研究工作与成果第11-12页
   ·论文的结构第12-13页
第二章 WEB文本信息抽取技术研究第13-23页
   ·网页的结构和内容第13-15页
     ·网页的基本结构第13-14页
     ·网页的内容特点第14-15页
   ·网页预处理第15-17页
     ·网页的标准化处理第15-16页
     ·噪音信息的初步过滤第16-17页
   ·网页内容提取第17-22页
     ·DOM文档对象模型第17-19页
     ·基于DOM的网页内容提取第19-22页
   ·本章小结第22-23页
第三章 文本分类技术研究第23-42页
   ·文本分类的基本知识第23-24页
     ·文本分类的概念第23页
     ·文本分类的过程第23-24页
   ·文本表示模型第24-26页
     ·布尔模型第25页
     ·向量空间模型第25-26页
   ·文本特征选择第26-30页
     ·文档频率第27页
     ·信息增益第27-28页
     ·CHI统计法第28-29页
     ·信息第29-30页
   ·文本分类算法第30-36页
     ·中心向量法第30-31页
     ·朴素贝叶斯方法第31页
     ·KNN方法第31-32页
     ·支持向量机第32-36页
   ·文本分类实验与结果分析第36-41页
     ·WEB文本分类实验平台第36-39页
     ·WEB文本分类实验结果第39-41页
   ·本章小结第41-42页
第四章 文本聚类技术研究第42-56页
   ·文本聚类的基本知识第42-43页
     ·文本聚类的概念第42页
     ·文本聚类的过程第42-43页
   ·文本聚类的特征选择第43-49页
     ·基于词性分析的特征选择第44-46页
     ·基于语义词典的特征选择第46-49页
   ·文本聚类算法第49-51页
     ·划分聚类算法第49页
     ·层次聚类算法第49-50页
     ·基于密度的聚类算法第50页
     ·基于网格的聚类算法第50-51页
   ·文本聚类实验与结果分析第51-55页
     ·文本聚类实验平台第51-53页
     ·文本聚类实验结果第53-55页
   ·本章小结第55-56页
第五章 主题搜索引擎的文本挖掘应用第56-66页
   ·主题搜索引擎第56-58页
   ·主题搜索引擎文本挖掘需求第58-61页
   ·主题搜索引擎文本挖掘实现第61-65页
     ·正文抽取子模块第61页
     ·属性信息抽取子模块第61-62页
     ·行业分类子模块第62-65页
   ·本章小结第65-66页
第六章 总结第66-68页
   ·全文总结第66-67页
   ·不足和展望第67-68页
参考文献第68-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:企业信息化软件服务提供商团队建设的研究
下一篇:基于ISO27001的京东方信息安全管理体系建设