首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

大规模信息过滤技术研究及其在Web问答系统中的应用

独创性声明第1页
 关于论文使用授权的说明第2-3页
摘要第3-4页
ABSTRACT第4-10页
第一章 信息过滤的研究背景、现状和意义第10-20页
   ·信息过滤的提出第10-11页
   ·信息过滤的发展历史第11-13页
   ·信息过滤的研究现状第13-15页
   ·信息过滤的意义第15-17页
   ·本文的组织结构第17-20页
第二章 信息过滤的模型和主要算法第20-40页
   ·信息过滤的特点第20-22页
     ·信息检索与信息过滤第20-21页
     ·信息过滤的分类第21-22页
   ·基于内容的信息过滤模型第22-25页
     ·信息过滤模型介绍第22-23页
     ·向量空间模型第23-25页
       ·向量空间表示法第23-24页
       ·样本相似性度量第24-25页
   ·信息过滤的主要方法概述第25-31页
     ·统计方法第25-29页
     ·逻辑方法第29-30页
     ·拟物方法第30-31页
   ·TREC 信息过滤任务第31-35页
     ·TREC 信息过滤任务概况第31-33页
     ·TREC 信息过滤任务的评测第33-35页
   ·我们的信息过滤系统简介第35-40页
     ·自适应过滤系统第35-37页
     ·自适应过滤的主要算法简介第37-40页
第三章 用户兴趣的二重构造算法及小样本主题优化第40-58页
   ·用户需求扩展第40-49页
     ·基于语义词典的用户需求扩展第41-43页
     ·基于词相似度计算的用户需求扩展第43-47页
       ·基于同义词词林的词相似度计算[116]第43-44页
       ·基于知网和同义词词林的词相似度计算[118]第44-47页
     ·基于相关反馈的用户需求扩展第47-49页
   ·用户兴趣构造的一般方法第49-50页
     ·基于伪相关文档的用户兴趣构造第49页
     ·基于Rocchio 算法的用户兴趣构造第49-50页
     ·基于增量式伪相关文档选择的用户兴趣构造第50页
   ·基于二重伪相关文档选择的用户兴趣构造方法第50-53页
     ·二重伪相关文档选择算法第51-52页
     ·实验结果第52-53页
   ·小样本主题的优化分析方法第53-56页
     ·小样本主题的判定第53-55页
     ·小样本主题的自我增强优化第55-56页
   ·用户需求迁移和用户兴趣漂移分析第56-58页
第四章 需求粒度驱动的柔性化特征选择算法第58-72页
   ·特征提取第58-60页
     ·文本特征描述第58-59页
     ·特征提取的粒度分析第59-60页
   ·传统的特征选择方法第60-63页
     ·词频方法第61页
     ·文档频次方法第61页
     ·交叉熵方法第61-62页
     ·互信息方法第62页
     ·信息增益方法第62-63页
     ·χ~2 统计量方法第63页
   ·用户需求粒度驱动的柔性化特征选择算法第63-69页
     ·用户需求的粒度分析第64-65页
     ·粗粒度用户需求的精细特征选择法第65-68页
       ·主题无关假设下的类互信息特征选择法第66页
       ·基于训练集的类互信息特征选择法第66-67页
       ·两种类互信息特征选择方法的实验结果比较第67-68页
     ·细粒度用户需求的粗略特征选择法第68-69页
       ·优化的文档频次特征选择方法第68-69页
       ·对比实验结果第69页
   ·平滑的特征权重计算方法第69-72页
第五章 基于不确定性信息的用户兴趣学习和局部目标函数优化制导的阈值调整第72-94页
   ·基于变化模型的用户兴趣更新第72-73页
   ·自适应过滤中用户兴趣更新的传统方法第73-76页
     ·用户兴趣更新的必要性第73-74页
     ·经典的Rocchio 更新算法第74-75页
     ·充分反馈条件下的Rocchio 更新算法第75-76页
   ·基于不确定信息的用户兴趣更新算法第76-81页
     ·局部代替整体的思想第76-77页
     ·基于正反例中心的未判定文档划分方法第77-78页
     ·未判定文档“功大于过”的思想第78-79页
     ·未判定文档“过大于功”的思想第79-81页
   ·过滤阈值调整的必要性及主要方法第81-84页
     ·固定的检出阈值第81-82页
     ·回归分析法(Logistic regression)第82页
     ·Beta-Gamma 阈值学习方法第82-83页
     ·高斯指数分布法第83-84页
   ·全局和局部目标函数优化制导的阈值调整第84-88页
     ·全局目标函数优化制导的阈值调整方法第84-86页
     ·局部目标函数优化制导的阈值调整方法第86-88页
   ·实验结果比较分析第88-94页
第六章 反向过滤技术及其与正向过滤相结合的双向过滤技术第94-106页
   ·反向过滤技术第94-97页
     ·反向过滤问题的提出第94页
     ·反向用户兴趣构建第94-97页
       ·否定形式的用户要求第94-95页
       ·反例形式的用户要求第95-97页
     ·反向过滤算法第97页
   ·正向过滤与反向过滤相结合的过滤技术第97-102页
     ·正向过滤中存在的问题第97-98页
     ·无反馈过滤系统中不相关信息用户兴趣的建立和应用第98-99页
     ·正向过滤和反向过滤相结合的自适应过滤算法第99-102页
   ·先反向后正向的双向过滤技术分析第102-106页
     ·基本思想和算法流程第102-103页
     ·双向过滤算法的理论分析第103-106页
第七章 信息过滤技术在 Web 问答系统中的应用第106-116页
   ·Web 问答系统介绍及其主要问题第106-107页
   ·问答系统的文档获取第107-111页
     ·传统的文档获取技术第107-109页
     ·基于信息过滤的文档获取技术第109-111页
   ·自适应问答系统第111-115页
     ·问答系统的学习问题第111页
     ·自适应答案过滤第111-113页
     ·自适应答案调整第113-115页
   ·本章小结第115-116页
第八章 实验结果比较与分析第116-122页
   ·数据集预处理第116-117页
   ·过滤主题介绍及处理第117-118页
   ·TREC-10 自适应过滤实验结果第118-119页
   ·TREC-11 自适应过滤实验结果第119-122页
第九章 结束语第122-130页
   ·本文主要贡献与创新第122-123页
   ·下一步研究工作第123-124页
   ·前景与展望第124-130页
参考文献第130-141页
致 谢第141-143页
作者简历第143-144页

论文共144页,点击 下载论文
上一篇:基于匹配跟踪的低速率视频编码
下一篇:中国乳品消费研究