首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web挖掘中的降维和分类方法研究

第1章 概述第1-29页
   ·研究的目的、意义及研究背景第12-13页
   ·Web挖掘研究的内容第13-15页
     ·Web内容挖掘第14页
     ·Web结构挖掘第14页
     ·Web使用挖掘第14-15页
   ·Web挖掘研究的关键技术第15-25页
     ·网页分类第15-19页
       ·文本分类算法第16-17页
       ·文本分类的评价第17-18页
       ·网页分类研究存在的问题第18-19页
     ·网页摘要第19-22页
       ·传统摘要算法第20-21页
       ·网页摘要的评价第21-22页
     ·Web搜索第22-23页
     ·Web挖掘中的降维方法研究第23-25页
       ·特征选择第24页
       ·奇异值分解(SVD)第24-25页
   ·Web挖掘的难点第25-26页
     ·需要多种Web挖掘技术的结合第25页
     ·复杂数据对Web挖掘研究提出挑战第25-26页
     ·使用Web数据中的用户知识提高挖掘性能第26页
   ·本文的研究重点、主要贡献和论文的组织第26-29页
     ·本文的研究内容第26-28页
     ·论文各部分的主要内容第28-29页
第2章 有监督的潜在语义索引(SLSI)模型第29-37页
   ·引言第29页
   ·相关研究工作第29-31页
   ·SLSI模型第31-34页
     ·SLSI算法描述第31-32页
     ·基向量的选择第32-33页
     ·SLSI和LSI的区别第33-34页
   ·试验和分析第34-36页
   ·本章小结和下一步研究工作讨论第36-37页
第3章 CubeSVD模型及其在个性化Web搜索中的应用第37-56页
   ·引言第37-38页
   ·个性化搜索和点击日志挖掘第38-40页
   ·张量和高阶奇异值分解第40-41页
   ·基于CubeSVD的Web搜索第41-49页
     ·CubeSVD算法第42页
     ·CubeSVD的一个例子第42-46页
     ·中心张量的维数选择第46-47页
     ·加权策略第47-48页
     ·平滑方法第48-49页
       ·基于常数的平滑第48页
       ·基于内容相似性的平滑第48-49页
     ·归一化方法第49页
   ·试验和分析第49-55页
     ·数据集第49-50页
     ·基准算法第50页
     ·评价方法第50-52页
     ·试验结果第52-55页
       ·中心张量维数对算法性能的影响第52页
       ·加权策略、平滑方法和归一化方法的影响第52-53页
       ·跟其它方法的比较第53页
       ·试验结论第53-55页
   ·本章小结和下一步研究工作讨论第55-56页
第4章 基于点击日志的改进型网页摘要算法第56-67页
   ·引言第56页
   ·相关研究工作第56-57页
   ·使用点击日志提高摘要性能第57-60页
     ·点击日志用于网页摘要的可行性研究第57-58页
     ·改进型网页摘要算法:ALSA第58-59页
     ·提高没有查询日志网页的摘要结果第59-60页
   ·试验和分析第60-66页
     ·数据集第61-62页
       ·人工标注的网页集第61页
       ·大规模测试集第61-62页
     ·评价方法第62页
     ·试验结果和讨论第62-66页
       ·有点击日志网页的摘要结果第62-63页
       ·没有点击日志网页的摘要结果第63-64页
       ·大规模测试集的摘要结果第64-65页
       ·讨论第65-66页
   ·本章小结和下一步研究工作讨论第66-67页
第5章 基于组合核函数的网页分类算法第67-80页
   ·引言第68-69页
   ·相关研究工作第69-70页
   ·核方法第70-71页
     ·核方法和核组合第70-71页
     ·核匹配第71页
   ·基于优化组合核函数的网页分类算法第71-74页
     ·优化组合核匹配第72-73页
     ·GE-CKO算法第73-74页
   ·试验和分析第74-78页
     ·数据集第74页
     ·评价方法第74页
     ·试验结果和讨论第74-77页
       ·基准算法第74-76页
       ·GE-CKO算法的泛化性能第76-77页
       ·多个核组合情况下GE-CKO算法的性能第77页
     ·讨论第77-78页
   ·本章小结和下一步研究工作讨论第78-80页
第6章 基于隐链接的网页分类算法第80-94页
   ·引言第80-81页
   ·相关研究工作第81-82页
   ·隐链接和超链接第82-84页
     ·隐链接和超链接的定义第82-83页
     ·隐链接和超链接的区别第83-84页
   ·基于隐链接的分类算法第84-85页
     ·基于链接邻居的分类(CLN)第84页
     ·基于虚拟文档表示的分类(VDBC)第84-85页
   ·试验和分析第85-92页
     ·试验数据第85-86页
     ·分类算法和评价方法第86-87页
     ·链接关系的统计第87-88页
     ·CLN算法分类结果第88页
     ·VDBC算法分类结果第88-92页
       ·不同虚拟文档表示方法的影响第89-90页
       ·组合网页局部文本的虚拟文档表示第90-91页
       ·点击日志数量对分类性能的影响第91-92页
   ·本章小结和下一步研究工作讨论第92-94页
第7章 Web挖掘原型系统第94-107页
   ·系统框架第94页
   ·WebME系统的特点第94-96页
   ·系统主要模块第96-98页
   ·WebME系统用于宏观经济领域的例子第98-103页
   ·本章小节和下一步研究工作讨论第103-107页
结论第107-109页
参考文献第109-118页
致谢及声明第118-119页
个人简历、在学期间发表的学术论文与研究成果第119-121页

论文共121页,点击 下载论文
上一篇:《内经》“肾主骨”理论与腰椎间盘突出症
下一篇:北京影响力公司的营销策略分析