首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向信息检索的Web文本挖掘方法研究

摘要第1-7页
Abstract第7-12页
第一章 绪论第12-25页
   ·研究背景及意义第12-15页
   ·Web挖掘概述第15-20页
     ·Web挖掘的概念及特点第15-16页
     ·Web挖掘分类第16-20页
   ·本文工作第20-25页
     ·论文的研究思路第20-22页
     ·本文主要研究内容与贡献第22-25页
第二章 研究综述第25-38页
   ·引言第25页
   ·Web文本挖掘国内外研究现状第25-36页
     ·Web文本挖掘基本过程第25-26页
     ·Web文本挖掘应用第26-28页
     ·研究热点与动态第28-32页
     ·商业应用及挖掘工具第32-34页
     ·尚待研究解决的问题第34-36页
   ·本章小结第36-38页
第三章 基于Naive Bayesian的增强EM半监督分类研究第38-50页
   ·引言第38-39页
   ·非平衡集上的特征选择第39-40页
   ·基于Naive Bayesian的增强EM算法第40-44页
     ·朴素贝叶斯分类第40-42页
     ·基本EM算法第42-43页
     ·增强EM算法第43-44页
   ·实验及结果分析第44-49页
     ·实验数据与评测标准第45页
     ·实验结果与分析第45-49页
   ·本章小结第49-50页
第四章 基于特征分布的半监督分类研究第50-59页
   ·引言第50-51页
   ·信息增益与特征分布第51-52页
   ·基于特征分布选择第52-53页
   ·实验及结果分析第53-57页
     ·数据准备与评测标准第54-55页
     ·实验结果与分析第55-57页
   ·本章小结第57-59页
第五章 基于强类别特征近邻传播的半监督聚类研究第59-72页
   ·引言第59-60页
   ·近邻消息传播算法第60-62页
     ·AP算法与K-means算法的区别第60-61页
     ·AP算法基本原理第61-62页
   ·基于强类别特征AP半监督聚类第62-65页
     ·夹角余弦系数相似性第62-63页
     ·带强类别特征的相似性度量第63-64页
     ·SCFAP半监督聚类算法第64-65页
   ·实验及结果分析第65-70页
     ·实验数据及准备第65-66页
     ·实验评测标准第66-67页
     ·实验结果与分析第67-70页
   ·本章小结第70-72页
第六章 融合种子扩散传播的半监督聚类研究第72-85页
   ·引言第72-73页
   ·种子扩散与净化第73-75页
   ·融合种子扩散传播的半监督聚类第75-78页
   ·实验及结果分析第78-84页
     ·实验准备及评价函数第78-79页
     ·实验比对算法第79-80页
     ·实验结果与分析第80-84页
   ·本章小结第84-85页
第七章 基于语义信息和后缀树的Web检索结果聚类研究第85-105页
   ·引言第85-86页
   ·相关研究工作第86-89页
   ·相关模型及理论第89-94页
     ·向量空间模型第89-91页
     ·后缀树模型第91-93页
     ·潜在语义索引第93-94页
   ·基于语义信息的Web片断后缀树聚类第94-101页
     ·基于语义信息的Web片断STC过程第94-95页
     ·Web文档预处理第95-96页
     ·发现基簇第96-98页
     ·合并基簇第98-100页
     ·为基簇选择短语标签第100-101页
   ·实验及结果分析第101-104页
     ·实验准备与评测标准第101-102页
     ·实验结果与分析第102-104页
   ·本章小结第104-105页
总结与展望第105-108页
 一.本文的主要工作和主要结论第105-106页
 二.本文的进一步研究方向第106-108页
参考文献第108-119页
攻读博士学位期间取得的研究成果第119-121页
致谢第121-122页
附件第122页

论文共122页,点击 下载论文
上一篇:基于计算机视觉的目标图像检索相关技术的研究
下一篇:基于本体的自动信任协商及其安全性研究