利用表格等信息的Web文本分类研究与实现
摘要 | 第1-6页 |
Abstract | 第6-7页 |
目录 | 第7-9页 |
contents | 第9-12页 |
1 绪论 | 第12-17页 |
·课题研究的目的和意义 | 第12-13页 |
·国内外研究概况 | 第13-15页 |
·国外研究概况 | 第13-14页 |
·国内研究概况 | 第14-15页 |
·论文的主要研究内容 | 第15-17页 |
2 Web文本分类方法的研究 | 第17-31页 |
·Web文本的特点 | 第17页 |
·Web文本分类的过程 | 第17-25页 |
·Web文本分类的定义 | 第17-19页 |
·文本表示 | 第19-20页 |
·自动分词技术 | 第20-22页 |
·特征提取 | 第22-25页 |
·常用的文本分类方法 | 第25-29页 |
·朴素贝叶斯算法 | 第25-26页 |
·KNN分类算法 | 第26-27页 |
·支持向量机 | 第27-29页 |
·支持向量机方法的研究和实验结果分析 | 第29-30页 |
·本章小结 | 第30-31页 |
3 本体理论 | 第31-44页 |
·本体概述 | 第31-34页 |
·本体定义 | 第31-32页 |
·本体的分类 | 第32页 |
·本体的描述语言 | 第32-33页 |
·本体建模原语 | 第33-34页 |
·本体构建方法学 | 第34-41页 |
·本体的建立原则 | 第34-35页 |
·本体构建方法 | 第35-41页 |
·本体构建工具 | 第41-43页 |
·本体构建工具的分类 | 第41页 |
·Protégé | 第41-43页 |
·本章小结 | 第43-44页 |
4 Web表格信息抽取 | 第44-65页 |
·目前的Web信息抽取方法 | 第44-47页 |
·HTML语言概述 | 第47-51页 |
·SGML简介 | 第47页 |
·HTML简介 | 第47-48页 |
·HTML语言结构分析 | 第48-49页 |
·HTML页面的特点 | 第49-51页 |
·Web表格信息抽取模型 | 第51-60页 |
·Web表格信息抽取概述 | 第51-52页 |
·Web表格信息抽取模型 | 第52页 |
·Web表格的定位 | 第52-57页 |
·Web表格结构预处理 | 第57-58页 |
·表格信息抽取与重构 | 第58-59页 |
·模型实验结果分析 | 第59-60页 |
·Web表格特征信息的抽取 | 第60-64页 |
·表格的结构类型 | 第60页 |
·表格特征信息识别 | 第60-61页 |
·表格单元信息类型识别 | 第61-64页 |
·本章小结 | 第64-65页 |
5 Web文本分类系统的设计与实现 | 第65-76页 |
·构建二次分类模型 | 第65-66页 |
·数据准备 | 第66页 |
·基于领域本体的分类模块 | 第66-71页 |
·构建基于领域本体的分类模块 | 第66-67页 |
·构建领域本体 | 第67-69页 |
·Web表格特征信息的表示 | 第69-71页 |
·引入概念关联度的主题分类模板 | 第71页 |
·相似度匹配 | 第71页 |
·实验结果与分析 | 第71-75页 |
·本章小结 | 第75-76页 |
6 结论与展望 | 第76-78页 |
·结论 | 第76页 |
·展望 | 第76-78页 |
参考文献 | 第78-82页 |
致谢 | 第82-83页 |
作者简介及读研期间主要科研成果 | 第83页 |