Web中文文本分类技术研究与实现
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-15页 |
·课题来源 | 第9页 |
·课题研究背景及意义 | 第9-10页 |
·国内外研究现状 | 第10-13页 |
·论文研究的主要内容 | 第13-14页 |
·论文组织结构 | 第14-15页 |
第2章 Web 中文文本分类主要技术 | 第15-22页 |
·Web 中文文本预处理 | 第16-17页 |
·Web 文本特征提取 | 第17-18页 |
·文本数学表示方法 | 第18-19页 |
·Web 文本权重计算 | 第19页 |
·Web 文本分类算法 | 第19-21页 |
·本章小结 | 第21-22页 |
第3章 Web 中文文本采集系统设计 | 第22-35页 |
·Web 文本特点分析 | 第22-23页 |
·试验样本采集系统设计 | 第23-33页 |
·设计总体框架 | 第23-24页 |
·网页爬虫设计 | 第24-26页 |
·Web 页面去噪分析 | 第26-28页 |
·实现去噪关键技术 | 第28-33页 |
·建立试验样本库 | 第33-34页 |
·本章小结 | 第34-35页 |
第4章 Web 中文文本特征选择研究及改进 | 第35-47页 |
·文本特征选择概述 | 第35页 |
·Web 文本处理思路改进 | 第35-38页 |
·处理思路改进前后试验与结果分析 | 第38-41页 |
·卡方统计概述 | 第41-42页 |
·分析卡方统计的不足 | 第42-43页 |
·卡方统计的改进 | 第43-44页 |
·词频补偿因子 | 第43页 |
·类别比重因子 | 第43-44页 |
·类内分布因子 | 第44页 |
·卡方统计改进前后试验与结果分析 | 第44-46页 |
·本章小结 | 第46-47页 |
第5章 KNN 文本分类算法研究及改进 | 第47-58页 |
·KNN 分类算法概述 | 第47-48页 |
·KNN 算法分类步骤探究 | 第48页 |
·相似度的计算 | 第48-49页 |
·分析 KNN 文本分类算法缺点 | 第49页 |
·KNN 文本分类算法的改进 | 第49-51页 |
·内积相似度缺点分析 | 第50页 |
·相似接近系数的提出 | 第50页 |
·改进后的方法分析对比 | 第50-51页 |
·KNN 改进前后试验与结果分析 | 第51-57页 |
·本章小结 | 第57-58页 |
第6章 Web 中文文本分类系统设计 | 第58-68页 |
·系统开发环境 | 第58页 |
·系统实现框图 | 第58-59页 |
·Web 网页采集系统 | 第59-60页 |
·分类系统模块 | 第60-63页 |
·分类系统简介 | 第60-61页 |
·分类试验条件及步骤 | 第61-63页 |
·结果评价系统 | 第63-67页 |
·分类结果评估 | 第63-65页 |
·结果评价系统 | 第65-67页 |
·本章小结 | 第67-68页 |
第7章 总结与展望 | 第68-71页 |
·本文总结 | 第68-69页 |
·研究展望 | 第69-71页 |
致谢 | 第71-72页 |
参考文献 | 第72-74页 |