摘要 | 第1-5页 |
Abstract | 第5-9页 |
1 绪论 | 第9-14页 |
·研究背景 | 第9-10页 |
·国内外研究现状 | 第10-12页 |
·文本分类现状 | 第10-11页 |
·电子邮件分类现状 | 第11页 |
·邮件作者研究现状 | 第11-12页 |
·中文邮件作者身份识别研究现状 | 第12页 |
·本文的章节安排 | 第12-14页 |
2 中文电子邮件作者身份识别相关理论与方法 | 第14-27页 |
·中文邮件特点及作者身份特征选取与表示 | 第14-17页 |
·中文电子邮件的特点 | 第14-16页 |
·中文邮件作者身份特征选取与表示 | 第16-17页 |
·知识发现与分类方法 | 第17-24页 |
·知识发现 | 第17-18页 |
·KNN | 第18-19页 |
·ANN | 第19-21页 |
·SVM | 第21-24页 |
·基于SVM的多类分类研究 | 第24-27页 |
·一对一实现多类分类 | 第24页 |
·一对余实现多类分类 | 第24-25页 |
·改进一对一拓扑的多类分类应用 | 第25-27页 |
3 中文电子邮件作者身份识别系统设计 | 第27-36页 |
·系统架构设计 | 第27-30页 |
·系统架构设计准则 | 第27页 |
·系统流程介绍 | 第27-28页 |
·系统架构设计 | 第28-30页 |
·数据库表设计与关系设计 | 第30-31页 |
·邮件提取接口及可扩展性 | 第31页 |
·邮件样本集的选取 | 第31页 |
·邮件文本预处理与标准化 | 第31-32页 |
·识别方法与工具的选取 | 第32页 |
·各类特征的选择与提取 | 第32-34页 |
·头信息提取 | 第32-33页 |
·语言特征提取 | 第33-34页 |
·格式特征提取 | 第34页 |
·结构特征提取 | 第34页 |
·写作风格特征提取 | 第34页 |
·特征权值计算模块 | 第34-35页 |
·单一/综合识别选择模块 | 第35页 |
·识别分类处理 | 第35页 |
·识别结果与评估结果展示 | 第35页 |
·系统设置 | 第35-36页 |
4 系统实现介绍及关键技术 | 第36-48页 |
·基于Outlook Express客户端的邮件提取模块 | 第36-41页 |
·提取Outlook Express中的邮件 | 第36-40页 |
·邮件提取工具接口标准 | 第40-41页 |
·特征选择与提取模块 | 第41-44页 |
·头信息提取 | 第41页 |
·分词与分词调节技术 | 第41-42页 |
·语言特征选择 | 第42-43页 |
·写作风格特征提取 | 第43-44页 |
·识别工具选取 | 第44-46页 |
·系统调用libsvm工具软件 | 第44-45页 |
·识别工具接口标准 | 第45-46页 |
·识别与评估结果展示 | 第46-47页 |
·识别结果 | 第46页 |
·识别性能评估结果 | 第46-47页 |
·系统设置展示 | 第47-48页 |
5 研究实验与结果分析 | 第48-52页 |
·数据集 | 第48页 |
·评估指标 | 第48-49页 |
·实验步骤 | 第49页 |
·实验结果及分析 | 第49-52页 |
·实验一的结果展示 | 第49-50页 |
·实验二的结果展示 | 第50-52页 |
6 结论与展望 | 第52-54页 |
参考文献 | 第54-58页 |
在读期间发表的学术论文 | 第58-59页 |
作者简历 | 第59-60页 |
致谢 | 第60页 |