前言 | 第1-5页 |
摘要 | 第5-7页 |
Abstract | 第7-12页 |
第1章 绪论 | 第12-16页 |
·研究背景及意义 | 第12-14页 |
·论文的主要工作 | 第14-15页 |
·论文的组织结构 | 第15-16页 |
第2章 论文的有效信息的提取 | 第16-25页 |
·PDF 文档格式介绍 | 第16-19页 |
·PDF 文档简介 | 第16-17页 |
·PDF 文档的结构和分析 | 第17-19页 |
·PDF 文件解析类库 PDFBox 的介绍 | 第19-20页 |
·论文的有效信息及提取的方法 | 第20-23页 |
·论文标题信息的提取 | 第21页 |
·论文作者信息的提取 | 第21-22页 |
·论文摘要信息的提取 | 第22页 |
·论文关键词信息的提取 | 第22-23页 |
·论文的有效信息的实现 | 第23-24页 |
·本章小结 | 第24-25页 |
第3章 论文摘要的主题句的提取 | 第25-39页 |
·中文分词 | 第25-29页 |
·中文分词介绍 | 第25页 |
·几种分词方法的介绍 | 第25-28页 |
·ICTCLAS 中文分词系统和 Lucene.Net 介绍 | 第28-29页 |
·中文分词的实现 | 第29页 |
·遗传算法介绍 | 第29-35页 |
·遗传算法概述 | 第29-32页 |
·选择操作 | 第32-33页 |
·杂交操作 | 第33-34页 |
·变异操作 | 第34-35页 |
·终止条件 | 第35页 |
·基于遗传算法的论文摘要主题句的提取的实现 | 第35-38页 |
·问题建模 | 第35-36页 |
·编码方案的确定 | 第36页 |
·适应度函数的确定 | 第36-37页 |
·选择操作的确定 | 第37-38页 |
·杂交操作的确定 | 第38页 |
·变异操作的确定 | 第38页 |
·本章小结 | 第38-39页 |
第4章 基于朴素贝叶斯算法的中文文本分类 | 第39-44页 |
·中文文本分类介绍 | 第39-40页 |
·朴素贝叶斯分类算法介绍 | 第40-41页 |
·基于朴素贝叶斯算法的中文文本分类器的实现 | 第41-43页 |
·问题定义 | 第41-42页 |
·中文分词 | 第42页 |
·特征向量的形成 | 第42页 |
·文本分类训练集介绍 | 第42页 |
·文本分类器的形成 | 第42-43页 |
·本章小结 | 第43-44页 |
第5章 总结 | 第44-45页 |
参考文献 | 第45-47页 |
致谢 | 第47页 |