利用表格等信息的Web文本分类研究与实现
| 摘要 | 第1-6页 |
| Abstract | 第6-7页 |
| 目录 | 第7-9页 |
| contents | 第9-12页 |
| 1 绪论 | 第12-17页 |
| ·课题研究的目的和意义 | 第12-13页 |
| ·国内外研究概况 | 第13-15页 |
| ·国外研究概况 | 第13-14页 |
| ·国内研究概况 | 第14-15页 |
| ·论文的主要研究内容 | 第15-17页 |
| 2 Web文本分类方法的研究 | 第17-31页 |
| ·Web文本的特点 | 第17页 |
| ·Web文本分类的过程 | 第17-25页 |
| ·Web文本分类的定义 | 第17-19页 |
| ·文本表示 | 第19-20页 |
| ·自动分词技术 | 第20-22页 |
| ·特征提取 | 第22-25页 |
| ·常用的文本分类方法 | 第25-29页 |
| ·朴素贝叶斯算法 | 第25-26页 |
| ·KNN分类算法 | 第26-27页 |
| ·支持向量机 | 第27-29页 |
| ·支持向量机方法的研究和实验结果分析 | 第29-30页 |
| ·本章小结 | 第30-31页 |
| 3 本体理论 | 第31-44页 |
| ·本体概述 | 第31-34页 |
| ·本体定义 | 第31-32页 |
| ·本体的分类 | 第32页 |
| ·本体的描述语言 | 第32-33页 |
| ·本体建模原语 | 第33-34页 |
| ·本体构建方法学 | 第34-41页 |
| ·本体的建立原则 | 第34-35页 |
| ·本体构建方法 | 第35-41页 |
| ·本体构建工具 | 第41-43页 |
| ·本体构建工具的分类 | 第41页 |
| ·Protégé | 第41-43页 |
| ·本章小结 | 第43-44页 |
| 4 Web表格信息抽取 | 第44-65页 |
| ·目前的Web信息抽取方法 | 第44-47页 |
| ·HTML语言概述 | 第47-51页 |
| ·SGML简介 | 第47页 |
| ·HTML简介 | 第47-48页 |
| ·HTML语言结构分析 | 第48-49页 |
| ·HTML页面的特点 | 第49-51页 |
| ·Web表格信息抽取模型 | 第51-60页 |
| ·Web表格信息抽取概述 | 第51-52页 |
| ·Web表格信息抽取模型 | 第52页 |
| ·Web表格的定位 | 第52-57页 |
| ·Web表格结构预处理 | 第57-58页 |
| ·表格信息抽取与重构 | 第58-59页 |
| ·模型实验结果分析 | 第59-60页 |
| ·Web表格特征信息的抽取 | 第60-64页 |
| ·表格的结构类型 | 第60页 |
| ·表格特征信息识别 | 第60-61页 |
| ·表格单元信息类型识别 | 第61-64页 |
| ·本章小结 | 第64-65页 |
| 5 Web文本分类系统的设计与实现 | 第65-76页 |
| ·构建二次分类模型 | 第65-66页 |
| ·数据准备 | 第66页 |
| ·基于领域本体的分类模块 | 第66-71页 |
| ·构建基于领域本体的分类模块 | 第66-67页 |
| ·构建领域本体 | 第67-69页 |
| ·Web表格特征信息的表示 | 第69-71页 |
| ·引入概念关联度的主题分类模板 | 第71页 |
| ·相似度匹配 | 第71页 |
| ·实验结果与分析 | 第71-75页 |
| ·本章小结 | 第75-76页 |
| 6 结论与展望 | 第76-78页 |
| ·结论 | 第76页 |
| ·展望 | 第76-78页 |
| 参考文献 | 第78-82页 |
| 致谢 | 第82-83页 |
| 作者简介及读研期间主要科研成果 | 第83页 |