首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向智能信息检索的Web挖掘关键技术研究

声明第1-4页
摘要第4-6页
Abstract第6-13页
第一章 前言第13-22页
   ·问题提出第13页
   ·智能信息检索第13-16页
     ·基于概念的信息检索第15页
     ·个性化服务第15页
     ·信息的合理分类/聚类第15-16页
   ·Web挖掘技术及其对智能信息检索的支持第16-20页
     ·数据挖掘第16-17页
     ·Web挖掘第17-19页
     ·分类/聚类对智能信息检索的支持第19-20页
   ·本文的组织第20-22页
第二章 相关概念与技术第22-34页
   ·分类/聚类概述第22-23页
   ·样本类型及相似性度量第23-26页
     ·样本类型第23-24页
     ·相似性度量第24-26页
   ·聚类分析第26-29页
     ·聚类分析步骤第26-27页
     ·几种常用的聚类策略第27-28页
     ·类的定义第28-29页
   ·本体介绍第29-34页
     ·构造本体的准则第30页
     ·本体方法学第30-31页
     ·本体的描述语言第31-32页
     ·本体的分类第32-33页
     ·本体的应用第33-34页
第三章 支持信息检索的数据预处理技术第34-59页
   ·问题提出第34页
   ·基于PDF文件的信息抽取第34-45页
     ·信息抽取过程第34-35页
     ·PDF文件解析第35-36页
       ·PDF文件的物理结构第36页
       ·PDF文件的逻辑结构第36页
       ·PDF文件解析器第36页
     ·格式标签注入第36-38页
     ·标签预处理第38页
     ·规则库第38-41页
       ·信息抽取规则与限定词库第38-40页
       ·标签一致性判定规则和冗余标签判定规则第40-41页
     ·模式匹配第41-43页
     ·实验分析第43-45页
       ·实验分析一第43-44页
       ·实验分析二第44-45页
   ·基于渐进式丰富词典的中文分词方法第45-50页
     ·中文分词方法第45-47页
       ·基于词典的分词方法第45-46页
       ·基于统计的分词方法第46-47页
       ·基于人工智能的分词方法第47页
     ·渐进式丰富词典第47-50页
       ·基本思路第47-48页
       ·分词算法第48-49页
       ·实验分析第49-50页
   ·Web日志预处理第50-58页
     ·Web数据源第50-51页
     ·Web日志数据的特点第51-52页
       ·HTTP协议对数据的影响第51-52页
       ·缓存导致的信息丢失第52页
       ·其它原因导致的数据不准确性第52页
     ·Web日志数据预处理过程及实现第52-58页
       ·数据清洗第53-54页
       ·用户识别第54页
       ·会话识别第54-56页
       ·路径补充第56-58页
   ·本章小结第58-59页
第四章 中文页面与Web用户分类技术第59-91页
   ·问题提出第59页
   ·常用分类方法第59-61页
     ·朴素贝叶斯方法第59-60页
     ·k-近邻方法第60页
     ·决策树方法第60页
     ·支持向量机方法第60-61页
   ·维数约减方法第61-64页
   ·改进的基于k近邻的中文文本分类方法第64-82页
     ·k-近邻方法的分类过程及改进思路第64-65页
     ·训练样本集的约减第65-70页
       ·基本思路第65-66页
       ·约减算法第66-67页
       ·实验分析第67-70页
     ·渐进式分类模式第70-72页
       ·基本思想第70-71页
       ·实验分析第71-72页
     ·基于本体的语义理解第72-79页
       ·基本思路第72-75页
       ·实验分析第75-79页
     ·基于遗传算法的k值学习第79-82页
       ·基本思路第79页
       ·学习k值的遗传算法第79-80页
       ·选择染色体的方法第80-81页
       ·杂交变异并形成新一代染色体第81页
       ·实验分析第81-82页
   ·基于神经网络的Web用户分类第82-90页
     ·神经网络概述第83页
     ·神经网络学习规则第83-85页
       ·Hebb型学习第84页
       ·误差修正学习第84-85页
       ·竞争型学习第85页
       ·随机型学习第85页
     ·前馈型神经网络第85-90页
       ·网络结构第85-86页
       ·数据规格化第86页
       ·误差函数第86-89页
       ·实验分析第89-90页
   ·本章小结第90-91页
第五章 面向页面和用户聚类的聚类分析技术第91-106页
   ·问题提出第91页
   ·主要聚类方法第91-95页
     ·划分方法第91-93页
     ·层次方法第93-94页
     ·局部方法第94页
     ·模型方法第94-95页
   ·对k-means算法的改进第95-99页
     ·k-means算法的一般过程第95-96页
     ·k-means改进算法的思想第96-97页
     ·改进的初始聚类中心选择算法第97-98页
     ·实验分析第98-99页
   ·DBSCAN改进算法第99-105页
     ·基本概念第99-100页
     ·DBSCAN算法第100页
     ·对DBSCAN算法的改进思路第100-102页
     ·MinPts的确定第102页
     ·Eps的确定第102页
     ·实验分析第102-105页
   ·本章小结第105-106页
第六章 智能信息检索系统原型第106-123页
   ·问题提出第106页
   ·个性化服务第106-108页
     ·个性化服务的定义第106-107页
     ·个性化服务系统的分类第107-108页
       ·基于规则的系统第107-108页
       ·基于内容过滤的系统第108页
       ·协作过滤系统第108页
   ·个性化服务的实现第108-113页
     ·收集用户访问信息第109页
     ·用户建模第109-111页
       ·手工建模第110页
       ·示例建模第110-111页
       ·自动建模第111页
     ·个性化推荐第111-113页
       ·基于规则的推荐技术第111-112页
       ·基于内容过滤的推荐技术第112页
       ·基于协作过滤的推荐技术第112-113页
   ·基于概念的信息检索第113-114页
   ·智能信息检索系统原型的设计与实现第114-122页
     ·系统结构第114-115页
     ·数据准备第115页
     ·用户访问信息的收集第115-116页
       ·用户访问信息第115页
       ·用户访问信息的收集第115-116页
     ·建立用户模型第116-117页
       ·综合用户建模方式第116页
       ·用户页面兴趣度第116-117页
     ·个性化推荐第117-121页
       ·基于内容过滤的个性化推荐第117-118页
       ·基于规则的个性化推荐第118页
       ·基于协作过滤的个性化推荐第118页
       ·专家推荐第118-119页
       ·个性化服务实例第119-121页
     ·概念检索的实现第121-122页
       ·概念处理第121页
       ·概念检索实例第121-122页
   ·本章小结第122-123页
第七章 总结与展望第123-125页
   ·总结第123-124页
   ·进一步工作第124-125页
参考文献第125-137页
致谢第137-138页
攻博期间发表的文章第138-139页
攻博期间参加和完成的科研项目第139-140页
作者简介第140页

论文共140页,点击 下载论文
上一篇:社会学习网络及其构建研究
下一篇:股份支付会计问题研究