首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于DOM的智能网页信息抽取技术研究

摘要第1-7页
Abstract第7-11页
1 绪论第11-16页
   ·课题研究背景第11-12页
   ·国内外发展状况第12-13页
   ·目标及任务第13-14页
   ·本文研究内容第14-15页
   ·论文结构第15-16页
2 WEB 信息抽取研究综述第16-26页
   ·信息抽取的概念和发展状况第16-18页
   ·网页信息抽取的方法第18-24页
     ·基于知识工程的方法第19页
     ·自动训练的方法第19-21页
     ·基于DOM 的WEB 抽取技术第21-24页
   ·信息抽取的问题与改进第24-25页
   ·本章小结第25-26页
3 关键技术与算法分析第26-37页
   ·DOM 技术研究第26-30页
     ·HTML 文档的树模型第27-28页
     ·文档树结构的编程接口第28-30页
   ·文本自动分类第30-36页
     ·文本分类概念和一般性描述第31-33页
     ·向量空间模型第33-35页
     ·KNN(K Nearest Neighbor,KNN)分类方法第35页
     ·支持向量机SVM(Support Vector Machine)方法第35-36页
   ·本章小结第36-37页
4 网页主体信息抽取方法设计第37-55页
   ·基于DOM 分析器的网页预处理第38-40页
     ·网页预处理第39-40页
     ·文本预处理的设计方法第40页
   ·特征提取与选择第40-44页
     ·标准特征向量的生成第41-43页
     ·评估函数第43-44页
   ·文本分类第44-49页
     ·KNN-SVM 分类算法分析第45-46页
     ·文本分类子系统结构图第46-47页
     ·分类结果第47-49页
   ·页面区域信息分割与抽取第49-54页
     ·网页结构分析第49-50页
     ·建立映射表第50-51页
     ·网页区域分割与识别第51-54页
   ·本章小结第54-55页
5 实验结果与性能分析第55-58页
   ·开发环境第55页
   ·系统界面第55-56页
   ·数据抽取实验评估第56-58页
6 结论和展望第58-59页
参考文献第59-62页
致谢第62-63页
个人简历第63页
在学期间发表的论文第63页

论文共63页,点击 下载论文
上一篇:基于XML和Web Services异构数据转换的设计与实现
下一篇:用于B/S架构的家电测试软件系统组件设计与实现