首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文网页形式自动分类

独创性说明第1-4页
摘要第4-5页
Abstract第5-8页
1 绪论第8-12页
   ·研究背景第8-9页
   ·应用领域第9-10页
   ·本文的工作第10-11页
   ·本文的结构第11-12页
2 网页形式分类相关知识及研究概述第12-24页
   ·网页形式分类的相关知识第12-17页
     ·网页形式分类基本概念第12-15页
     ·网页形式分类的相关问题第15-17页
   ·网页形式分类的研究概述第17-22页
     ·文本体裁分类的研究第18-19页
     ·国外网页形式分类的研究第19-21页
     ·国内形式分类的研究第21-22页
   ·研究趋势和难点第22-24页
     ·网页形式分类的发展趋势第22页
     ·网页形式分类的难点第22-24页
3 语料库建立及预处理第24-33页
   ·确定形式类别第24-26页
     ·相关研究第24-25页
     ·本文的形式类别体系第25-26页
   ·构建语料库第26-28页
     ·相关研究第26-27页
     ·一种网页排序算法第27页
     ·语料库的获取第27-28页
   ·语料库的预处理第28-33页
     ·网页去噪的相关工作第29页
     ·网页去噪方法和算法第29-33页
4 特征项选择与提取第33-49页
   ·网页的URL第33-34页
   ·风格特征项第34-35页
   ·形态上的特征项第35-37页
   ·内容特征项第37-39页
   ·特征项的构建第39-43页
     ·特征项的度量第39-41页
     ·特征项的选择第41-43页
   ·网页形式分类特征项的抽取第43-48页
     ·词汇包方法基本原理第43-45页
     ·符号特征的提取第45-47页
     ·位置特征的提取第47页
     ·统计特征的提取第47-48页
   ·特征项数据预处理第48-49页
5 中文网页形式自动分类机制第49-56页
   ·系统概述第49-51页
     ·形式分类的形式化描述第49页
     ·系统整体设计思想第49-50页
     ·输入输出内容格式第50页
     ·系统实现采用的语言第50-51页
   ·分类器第51页
   ·分类语料说明第51-52页
   ·分类结果评价第52-56页
     ·系统分类评价指标第52-54页
     ·系统分类结果分析第54-55页
     ·系统优缺点分析第55-56页
结论第56-57页
参考文献第57-60页
攻读硕士学位期间发表学术论文情况第60-61页
致谢第61-62页
大连理工大学学位论文版权使用授权书第62页

论文共62页,点击 下载论文
上一篇:我国个人金融理财业务的发展探索
下一篇:能源有效的无线传感器网络协议