| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 1 绪论 | 第8-19页 |
| ·项目背景以及研究意义 | 第8-9页 |
| ·国内外的基本研究概况 | 第9-10页 |
| ·WEB 文本获取技术 | 第10-12页 |
| ·文本分类技术 | 第12-16页 |
| ·SVM 技术 | 第16-17页 |
| ·主要工作和论文结构 | 第17-19页 |
| 2 WEB 文本获取的设计 | 第19-30页 |
| ·总体构架 | 第19-20页 |
| ·网络爬虫设计 | 第20-25页 |
| ·基于模板的 Web 文本抽取 | 第25-29页 |
| ·本章小结 | 第29-30页 |
| 3 文本分类的设计 | 第30-38页 |
| ·总体构架 | 第30-31页 |
| ·中文分词 | 第31-33页 |
| ·文本特征选取的策略 | 第33-35页 |
| ·文本分类器 | 第35-37页 |
| ·本章小结 | 第37-38页 |
| 4 文本分类系统详细设计 | 第38-46页 |
| ·概述 | 第38-39页 |
| ·文本采集模块 | 第39-43页 |
| ·文本分类模块 | 第43-45页 |
| ·本章小结 | 第45-46页 |
| 5 实验结果及分析 | 第46-50页 |
| ·基于模板的信息抽取实验 | 第46-47页 |
| ·文本分类器的分类效果实验 | 第47-48页 |
| ·本章小结 | 第48-50页 |
| 6 总结与展望 | 第50-51页 |
| 致谢 | 第51-52页 |
| 参考文献 | 第52-55页 |