| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 1 绪论 | 第9-14页 |
| ·研究背景 | 第9-10页 |
| ·国内外研究现状 | 第10-12页 |
| ·文本分类现状 | 第10-11页 |
| ·电子邮件分类现状 | 第11页 |
| ·邮件作者研究现状 | 第11-12页 |
| ·中文邮件作者身份识别研究现状 | 第12页 |
| ·本文的章节安排 | 第12-14页 |
| 2 中文电子邮件作者身份识别相关理论与方法 | 第14-27页 |
| ·中文邮件特点及作者身份特征选取与表示 | 第14-17页 |
| ·中文电子邮件的特点 | 第14-16页 |
| ·中文邮件作者身份特征选取与表示 | 第16-17页 |
| ·知识发现与分类方法 | 第17-24页 |
| ·知识发现 | 第17-18页 |
| ·KNN | 第18-19页 |
| ·ANN | 第19-21页 |
| ·SVM | 第21-24页 |
| ·基于SVM的多类分类研究 | 第24-27页 |
| ·一对一实现多类分类 | 第24页 |
| ·一对余实现多类分类 | 第24-25页 |
| ·改进一对一拓扑的多类分类应用 | 第25-27页 |
| 3 中文电子邮件作者身份识别系统设计 | 第27-36页 |
| ·系统架构设计 | 第27-30页 |
| ·系统架构设计准则 | 第27页 |
| ·系统流程介绍 | 第27-28页 |
| ·系统架构设计 | 第28-30页 |
| ·数据库表设计与关系设计 | 第30-31页 |
| ·邮件提取接口及可扩展性 | 第31页 |
| ·邮件样本集的选取 | 第31页 |
| ·邮件文本预处理与标准化 | 第31-32页 |
| ·识别方法与工具的选取 | 第32页 |
| ·各类特征的选择与提取 | 第32-34页 |
| ·头信息提取 | 第32-33页 |
| ·语言特征提取 | 第33-34页 |
| ·格式特征提取 | 第34页 |
| ·结构特征提取 | 第34页 |
| ·写作风格特征提取 | 第34页 |
| ·特征权值计算模块 | 第34-35页 |
| ·单一/综合识别选择模块 | 第35页 |
| ·识别分类处理 | 第35页 |
| ·识别结果与评估结果展示 | 第35页 |
| ·系统设置 | 第35-36页 |
| 4 系统实现介绍及关键技术 | 第36-48页 |
| ·基于Outlook Express客户端的邮件提取模块 | 第36-41页 |
| ·提取Outlook Express中的邮件 | 第36-40页 |
| ·邮件提取工具接口标准 | 第40-41页 |
| ·特征选择与提取模块 | 第41-44页 |
| ·头信息提取 | 第41页 |
| ·分词与分词调节技术 | 第41-42页 |
| ·语言特征选择 | 第42-43页 |
| ·写作风格特征提取 | 第43-44页 |
| ·识别工具选取 | 第44-46页 |
| ·系统调用libsvm工具软件 | 第44-45页 |
| ·识别工具接口标准 | 第45-46页 |
| ·识别与评估结果展示 | 第46-47页 |
| ·识别结果 | 第46页 |
| ·识别性能评估结果 | 第46-47页 |
| ·系统设置展示 | 第47-48页 |
| 5 研究实验与结果分析 | 第48-52页 |
| ·数据集 | 第48页 |
| ·评估指标 | 第48-49页 |
| ·实验步骤 | 第49页 |
| ·实验结果及分析 | 第49-52页 |
| ·实验一的结果展示 | 第49-50页 |
| ·实验二的结果展示 | 第50-52页 |
| 6 结论与展望 | 第52-54页 |
| 参考文献 | 第54-58页 |
| 在读期间发表的学术论文 | 第58-59页 |
| 作者简历 | 第59-60页 |
| 致谢 | 第60页 |