首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

基于分块特征抽取的大规模网页分类研究

内容提要第1-7页
第一章 绪论第7-19页
   ·网页分类在Web数据挖掘中的意义第7-11页
     ·Web数据挖掘第7-9页
     ·网页分类在Web数据挖掘中的意义第9-11页
   ·网页分类技术第11-17页
     ·网页分类技术概述第11-13页
     ·网页分类的历史和现状第13-17页
   ·本文的主要研究内容和组织结构第17-19页
第二章 统计机器学习理论第19-25页
   ·机器学习的基本问题第19-21页
     ·机器学习问题的描述第19-20页
     ·经验风险最小化第20页
     ·经验风险的复杂性与推广能力第20-21页
   ·统计学习理论第21-24页
     ·VC维第21-22页
     ·推广性的界第22-23页
     ·结构风险最小化原则(SRM原则)第23-24页
   ·小结第24-25页
第三章 基于分块的网页特征抽取第25-38页
   ·网页的文本特征第25-27页
     ·信息增益(InformationGain)第26页
     ·词频和逆文档频(TF*IDF)第26-27页
   ·网页的结构化特征第27-29页
     ·HTML标记特征第27-28页
     ·网页分块特征第28-29页
   ·网页的分块第29-33页
     ·Dom树第29-30页
     ·可视化优先级Dom树(VisualPriorityDom Tree)第30-31页
     ·分块的属性第31-33页
   ·基于人工神经网络的网页分块第33-36页
   ·基于分块的特征抽取方法第36-38页
第四章 基于层次式支持向量机的网页分类算法第38-45页
   ·支持向量机第38-42页
     ·最优分类平面第38-40页
     ·支持向量机第40-41页
     ·核函数第41-42页
   ·多分类SVM方法第42页
   ·层次式SVM方法第42-45页
     ·水平分类法和层次式分类法第42-43页
     ·层次式SVM的训练策略和参数的选择第43-45页
第五章 实验结果及分析第45-51页
   ·网页分类的评价标准第45-46页
   ·数据集分布情况第46-47页
   ·分类准确度实验第47-49页
   ·分类性能实验第49页
   ·实验结果分析第49-51页
第六章 总结第51-54页
   ·总结第51-52页
   ·展望第52-54页
参考文献第54-57页
摘要第57-60页
ABSTRACT第60-63页
致谢第63-64页
导师及作者简介第64页

论文共64页,点击 下载论文
上一篇:中等师范学校幼师学生专业素养提升的教学策略研究
下一篇:美国大学校园文化德育的研究