| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 1 绪论 | 第8-13页 |
| ·文本自动分类研究背景 | 第8页 |
| ·文本自动分类的国内外研究现状 | 第8-10页 |
| ·国外研究现状 | 第8-10页 |
| ·国内研究现状 | 第10页 |
| ·本文主要研究内容 | 第10-11页 |
| ·论文组织结构 | 第11-13页 |
| 2 文本分类理论与技术基础 | 第13-24页 |
| ·文本分类基本概念 | 第13页 |
| ·文本分类涉及的主要技术及方法 | 第13-22页 |
| ·文本自动分词 | 第13-15页 |
| ·文本表示 | 第15-17页 |
| ·文本的特征选择与提取 | 第17-18页 |
| ·文本特征项的权重 | 第18-19页 |
| ·文本分类算法 | 第19-22页 |
| ·文本分类评价体系 | 第22-24页 |
| ·查全率(Recall)与查准率(Precision) | 第22-23页 |
| ·BEP 和F 函数 | 第23页 |
| ·宏平均和微平均 | 第23-24页 |
| 3 投诉领域分类系统库SLCC 构建方法 | 第24-32页 |
| ·SLCC 概述 | 第24-25页 |
| ·SLCC 的类别层次结构 | 第25-26页 |
| ·基于关键词组的分类体系库 | 第26-32页 |
| ·关键词组的形式化描述 | 第26-27页 |
| ·关键词组的存储结构 | 第27页 |
| ·模糊词典的构建 | 第27-29页 |
| ·索引机制 | 第29-32页 |
| 4 文本分类关键技术研究 | 第32-37页 |
| ·文本自动分词 | 第32-35页 |
| ·基于最大匹配分词算法的文本自动分词 | 第32-33页 |
| ·歧义字段的采集 | 第33-34页 |
| ·歧义字段的消解 | 第34页 |
| ·本文的自动分词流程 | 第34-35页 |
| ·文本自动分类 | 第35-37页 |
| ·传统的 KNN 算法 | 第35页 |
| ·基于关键词组的改进KNN 算法 | 第35-37页 |
| 5 中文文本投诉信息自动分类系统的设计与实现 | 第37-44页 |
| ·系统的总体结构 | 第37-39页 |
| ·系统设计思路 | 第37页 |
| ·系统的结构和模块设计 | 第37-39页 |
| ·系统的运行结果及分析 | 第39-44页 |
| ·开发工具及系统运行环境 | 第39-41页 |
| ·系统运行结果分析 | 第41-44页 |
| 6 总结与展望 | 第44-46页 |
| ·工作总结 | 第44-45页 |
| ·课题展望 | 第45-46页 |
| 参考文献 | 第46-49页 |
| 致谢 | 第49-50页 |
| 在学期间公开发表论文及著作情况 | 第50页 |