PDF格式中文科技论文的有效信息提取方法及分类研究

前言	第1-5页
摘要	第5-7页
Abstract	第7-12页
第1章绪论	第12-16页
·研究背景及意义	第12-14页
·论文的主要工作	第14-15页
·论文的组织结构	第15-16页
第2章论文的有效信息的提取	第16-25页
·PDF 文档格式介绍	第16-19页
·PDF 文档简介	第16-17页
·PDF 文档的结构和分析	第17-19页
·PDF 文件解析类库 PDFBox 的介绍	第19-20页
·论文的有效信息及提取的方法	第20-23页
·论文标题信息的提取	第21页
·论文作者信息的提取	第21-22页
·论文摘要信息的提取	第22页
·论文关键词信息的提取	第22-23页
·论文的有效信息的实现	第23-24页
·本章小结	第24-25页
第3章论文摘要的主题句的提取	第25-39页
·中文分词	第25-29页
·中文分词介绍	第25页
·几种分词方法的介绍	第25-28页
·ICTCLAS 中文分词系统和 Lucene.Net 介绍	第28-29页
·中文分词的实现	第29页
·遗传算法介绍	第29-35页
·遗传算法概述	第29-32页
·选择操作	第32-33页
·杂交操作	第33-34页
·变异操作	第34-35页
·终止条件	第35页
·基于遗传算法的论文摘要主题句的提取的实现	第35-38页
·问题建模	第35-36页
·编码方案的确定	第36页
·适应度函数的确定	第36-37页
·选择操作的确定	第37-38页
·杂交操作的确定	第38页
·变异操作的确定	第38页
·本章小结	第38-39页
第4章基于朴素贝叶斯算法的中文文本分类	第39-44页
·中文文本分类介绍	第39-40页
·朴素贝叶斯分类算法介绍	第40-41页
·基于朴素贝叶斯算法的中文文本分类器的实现	第41-43页
·问题定义	第41-42页
·中文分词	第42页
·特征向量的形成	第42页
·文本分类训练集介绍	第42页
·文本分类器的形成	第42-43页
·本章小结	第43-44页
第5章总结	第44-45页
参考文献	第45-47页
致谢	第47页