首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网页内容过滤的关键技术研究及实现

摘要第1-8页
ABSTRACT第8-10页
第一章 前言第10-13页
 1.1 课题的背景及意义第10-11页
 1.2 本文的工作与创新第11-12页
 1.3 本文的组织第12-13页
第二章 相关技术研究第13-35页
 2.1 网页过滤技术第13-18页
  2.1.1 内容分级标注第13-15页
  2.1.2 URL过滤第15-16页
  2.1.3 智能内容分析第16-17页
  2.1.4 当前的网页过滤系统第17-18页
 2.2 信息过滤模型第18-21页
  2.2.1 布尔模型第19页
  2.2.2 向量空间模型第19-20页
  2.2.3 概率模型第20-21页
 2.3 DOM技术探讨第21-27页
  2.3.1 HTML、XML和 XHTML第22-25页
   2.3.1.1 可标记超文本语言 HTML第22-23页
   2.3.1.2 可扩展标记语言 XML第23页
   2.3.1.3 可扩展超文本标记语言 XHTML第23-25页
  2.3.2 文档对象模型 DOM第25-26页
  2.3.3 基于 DOM的网页解析第26-27页
 2.4 中文分词技术第27-31页
  2.4.1 中文分词综述第27-28页
  2.4.2 中文分词技术第28-30页
   2.4.2.1 基于字符串匹配的分词方法第28-29页
   2.4.2.2 基于理解的分词方法第29页
   2.4.2.3 基于统计的分词方法第29-30页
  2.4.3 分词中的难题第30-31页
   2.4.3.1 歧义识别第30-31页
   2.4.3.2 新词识别第31页
 2.5 自动文本分类(Text Categorization)第31-35页
  2.5.1 KNN(Nearest Neighbour,NN)分类方法第32-33页
  2.5.2 支持向量机 SVM(Support Vector Machine)方法第33页
  2.5.3 基于神经网络的文本分类第33-35页
第三章 机器学习和神经网络第35-42页
 3.1 人工智能与机器学习第35-36页
 3.2 神经网络第36-38页
 3.3 自组织特征映射神经网络第38-39页
 3.4 Kohonen学习算法第39-42页
第四章 网页内容智能过滤的设计和实现第42-54页
 4.1 总体设计第42-44页
 4.2 预处理第44-50页
  4.2.1 基于 DOM的网页解析第45-49页
  4.2.2 中文分词模块第49-50页
 4.3 特征提取第50-51页
 4.4 向量生成第51-52页
 4.5 网页分类器第52-53页
 4.6 实验结果及分析第53-54页
第五章 总结与展望第54-55页
参考文献第55-59页
致谢第59-60页
攻读学位期间发表的学术论文目录第60-61页
学位论文评阅及答辩情况表第61页

论文共61页,点击 下载论文
上一篇:白血病细胞遗传学改变及其临床意义
下一篇:长期吸入糖皮质激素对支气管哮喘儿童生长激素-胰岛素样生长因子系统的影响