| 前言 | 第1-5页 |
| 摘要 | 第5-7页 |
| Abstract | 第7-12页 |
| 第1章 绪论 | 第12-16页 |
| ·研究背景及意义 | 第12-14页 |
| ·论文的主要工作 | 第14-15页 |
| ·论文的组织结构 | 第15-16页 |
| 第2章 论文的有效信息的提取 | 第16-25页 |
| ·PDF 文档格式介绍 | 第16-19页 |
| ·PDF 文档简介 | 第16-17页 |
| ·PDF 文档的结构和分析 | 第17-19页 |
| ·PDF 文件解析类库 PDFBox 的介绍 | 第19-20页 |
| ·论文的有效信息及提取的方法 | 第20-23页 |
| ·论文标题信息的提取 | 第21页 |
| ·论文作者信息的提取 | 第21-22页 |
| ·论文摘要信息的提取 | 第22页 |
| ·论文关键词信息的提取 | 第22-23页 |
| ·论文的有效信息的实现 | 第23-24页 |
| ·本章小结 | 第24-25页 |
| 第3章 论文摘要的主题句的提取 | 第25-39页 |
| ·中文分词 | 第25-29页 |
| ·中文分词介绍 | 第25页 |
| ·几种分词方法的介绍 | 第25-28页 |
| ·ICTCLAS 中文分词系统和 Lucene.Net 介绍 | 第28-29页 |
| ·中文分词的实现 | 第29页 |
| ·遗传算法介绍 | 第29-35页 |
| ·遗传算法概述 | 第29-32页 |
| ·选择操作 | 第32-33页 |
| ·杂交操作 | 第33-34页 |
| ·变异操作 | 第34-35页 |
| ·终止条件 | 第35页 |
| ·基于遗传算法的论文摘要主题句的提取的实现 | 第35-38页 |
| ·问题建模 | 第35-36页 |
| ·编码方案的确定 | 第36页 |
| ·适应度函数的确定 | 第36-37页 |
| ·选择操作的确定 | 第37-38页 |
| ·杂交操作的确定 | 第38页 |
| ·变异操作的确定 | 第38页 |
| ·本章小结 | 第38-39页 |
| 第4章 基于朴素贝叶斯算法的中文文本分类 | 第39-44页 |
| ·中文文本分类介绍 | 第39-40页 |
| ·朴素贝叶斯分类算法介绍 | 第40-41页 |
| ·基于朴素贝叶斯算法的中文文本分类器的实现 | 第41-43页 |
| ·问题定义 | 第41-42页 |
| ·中文分词 | 第42页 |
| ·特征向量的形成 | 第42页 |
| ·文本分类训练集介绍 | 第42页 |
| ·文本分类器的形成 | 第42-43页 |
| ·本章小结 | 第43-44页 |
| 第5章 总结 | 第44-45页 |
| 参考文献 | 第45-47页 |
| 致谢 | 第47页 |