首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web文档分类及信息抽取的研究与开发

引  言第1-9页
第一章 绪  论第9-22页
 1.1 背景、意义第9-11页
 1.2 目标及任务第11-12页
 1.3 关键技术第12-19页
  1.3.1 文档分类第12-17页
  1.3.2 信息抽取第17-19页
  1.3.3 自适应学习第19页
 1.4 JAVA简介第19-21页
 1.5 小结第21-22页
第二章 WEB文档自动分类引擎第22-43页
 2.1 网页自动分类引擎的系统结构第22-23页
 2.2 学习模块第23-30页
  2.2.1 预挖掘第23-25页
  2.2.2 分类规则的抽出第25-27页
  2.2.3 特征规则的生成第27-30页
 2.3 自动分类模块第30-32页
  2.3.1 计算文档的特征向量第30页
  2.3.2 分类结果的得出第30-32页
 2.4 人工干预的机器学习分类法第32-33页
 2.5 分类引擎的数据格式第33-41页
  2.5.1 学习文档目录文件第33-34页
  2.5.2 Html标记文件第34页
  2.5.3 Stop-words文件第34-35页
  2.5.4 单词文件第35页
  2.5.5 统计信息文本第35-38页
  2.5.6 分类引擎程序界面第38-41页
 2.6 实验结果第41-42页
 2.7 小结第42-43页
第三章 WEB表格的信息抽取第43-61页
 3.1 开发背景及目的第43-44页
 3.2 系统构成第44-46页
 3.3 二叉树构建工具第46-58页
  3.3.1 Htmlparser类第46-48页
  3.3.2 TagNode类第48-50页
  3.3.3 TagTree类第50-57页
  3.3.4 信息抽取工具第57-58页
 3.4 重点问题—二叉树模型的选取第58-59页
 3.5 信息抽取示例第59-60页
 3.6 小结第60-61页
第四章 结束语第61-62页
致  谢第62-63页
参考文献第63页

论文共63页,点击 下载论文
上一篇:含有机配体的稀土杂多配合物的合成、性质及理论计算
下一篇:快速液相沉积致密化工艺碳前驱体环己烷的热裂解机理