基于写作风格的中文邮件作者身份识别技术研究
1 引言 | 第1-17页 |
·研究背景和意义 | 第8-9页 |
·研究背景 | 第8-9页 |
·研究意义 | 第9页 |
·国内外研究现状 | 第9-15页 |
·写作风格和作者判定 | 第9-12页 |
·因特网上的写作风格鉴别 | 第12-13页 |
·文本分类与电子邮件作者身份识别分类 | 第13-15页 |
·问题综述 | 第15-16页 |
·本文的主要工作 | 第16-17页 |
2 中文邮件作者识别原理 | 第17-21页 |
·作者身份鉴别的普通方法 | 第17页 |
·中文电子邮件身份识别方法的比较研究 | 第17-18页 |
·中文电子邮件作者身份识别及其难点 | 第18-19页 |
·中文电子邮件作者识别系统的总体方案 | 第19-21页 |
3 中文电子邮件写作风格研究 | 第21-33页 |
·中文电子邮件特点 | 第21页 |
·中文电子邮件特征的分析研究 | 第21-28页 |
·语言特征研究 | 第22-24页 |
·非语言因素特征分析 | 第24-28页 |
·中文电子邮件特征提取与利用方法研究 | 第28-33页 |
·特征提取方法研究 | 第28-30页 |
·特征表达与利用方法研究 | 第30-33页 |
4 基于SVM的中文邮件作者身份识别算法研究 | 第33-46页 |
·统计学习理论 | 第33-34页 |
·机器学习 | 第33页 |
·经验风险最小化原理 | 第33-34页 |
·VC维 | 第34页 |
·结构风险最小归纳原理 | 第34页 |
·支持向量机算法原理 | 第34-39页 |
·线性支持向量机 | 第34-36页 |
·非线性支持向量机 | 第36-38页 |
·支持向量机训练算法 | 第38-39页 |
·支持向量机多类分类 | 第39-40页 |
·基于SVM算法的中文电子邮件作者识别研究 | 第40-43页 |
·分类方法 | 第40-41页 |
·k分交叉评价 | 第41-42页 |
·评估方法 | 第42-43页 |
·新邮件的验证算法研究 | 第43-46页 |
5 研究实验 | 第46-54页 |
·数据集 | 第46页 |
·实验步骤 | 第46-47页 |
·实验结果及其分析 | 第47-54页 |
6 结论 | 第54-55页 |
参考文献 | 第55-59页 |
附录Ⅰ 汉语文本词性标注标记集 | 第59-61页 |
附录Ⅱ 典型的LIBSVM-2.5的输入数据格式 | 第61-62页 |
附录Ⅲ F值表 | 第62-63页 |
在读期间发表的学术论文 | 第63-64页 |
作者简历 | 第64-65页 |
致谢 | 第65-70页 |