首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文档内容抽取与特征选择技术的研究与实现

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-13页
   ·研究背景与意义第7-8页
   ·国内外研究现状第8-10页
     ·文本信息抽取技术第8-9页
     ·文本特征选择技术第9-10页
   ·本文研究内容第10页
   ·论文组织结构第10-13页
第二章 相关理论和技术第13-19页
   ·网页正文抽取技术第13-15页
   ·信息熵理论第15-17页
     ·信息熵第15-16页
     ·条件熵第16-17页
     ·互信息第17页
   ·中文分词技术第17-18页
   ·本章小结第18-19页
第三章 多格式文档内容抽取技术研究第19-31页
   ·多格式文档内容抽取的问题分析第19页
   ·多格式文档内容抽取模型第19-22页
   ·内容抽取算法研究第22-30页
     ·HTML 文档内容抽取第22-26页
     ·WORD 文档内容抽取第26-27页
     ·XML 文档内容抽取第27-29页
     ·文档 PDF 内容抽取第29-30页
   ·本章小结第30-31页
第四章 基于信息增益和内容属性的特征选择算法第31-39页
   ·文本的向量空间模型第31页
   ·文本特征选择问题分析第31-33页
   ·文本特征选择算法设计第33-38页
     ·词性过滤第34-36页
     ·内容选择第36页
     ·CPIG 特征选择算法第36-38页
   ·本章小结第38-39页
第五章 多格式文档抽取系统的设计与实现第39-51页
   ·系统设计目标第39页
   ·系统总体设计第39-41页
     ·系统体系结构第39-40页
     ·系统功能模块第40-41页
   ·主要模块设计与实现第41-49页
     ·文档内容抽取模块第41-45页
     ·特征选择模块第45-48页
     ·数据传输和服务调用第48-49页
   ·本章小结第49-51页
第六章 实验研究与系统测试第51-57页
   ·实验设计第51-52页
     ·实验内容第51页
     ·性能评价标准第51-52页
     ·实验环境和数据集第52页
   ·实验结果及分析第52-54页
   ·MDES 系统测试第54-56页
     ·文档抽取测试第54-55页
     ·特征选择测试第55-56页
     ·服务调用测试第56页
   ·本章小结第56-57页
第七章 总结与展望第57-59页
致谢第59-61页
参考文献第61-63页
在读期间研究成果第63-64页

论文共64页,点击 下载论文
上一篇:Web日志挖掘原型系统的设计与实现
下一篇:基于J2EE的咸阳师范学院OA系统的设计与实现