摘要 | 第1-5页 |
Abstract | 第5-9页 |
1 绪论 | 第9-19页 |
·研究背景和研究意义 | 第9-11页 |
·研究背景 | 第9-10页 |
·研究意义 | 第10-11页 |
·国内外研究现状 | 第11-17页 |
·写作风格和作者身份分析 | 第11-12页 |
·侦查语言学和作者个性特征研究 | 第12-13页 |
·性别语言差异与作者性别判定 | 第13-15页 |
·文本分类与电子邮件作者身份识别分类 | 第15-17页 |
·针对网上信息描述对象的性别识别研究 | 第17页 |
·问题综述 | 第17页 |
·本文的章节安排 | 第17-19页 |
2 中文电子邮件作者性别识别方法和识别过程研究 | 第19-23页 |
·书面语言作者性别识别的一般方法 | 第19页 |
·中文电子邮件作者性别识别方法研究 | 第19-20页 |
·中文电子邮件作者性别识别的难点 | 第20页 |
·中文电子邮件作者性别识别过程 | 第20-23页 |
3 基于邮件内容的作者性别特征分析和提取研究 | 第23-35页 |
·性别言语差异 | 第23-25页 |
·性别言语差异的形成原因 | 第23页 |
·性别语言差异的表现 | 第23-25页 |
·中文电子邮件中与作者性别相关的特征的分析研究 | 第25-29页 |
·中文电子邮件的一般特点 | 第25-26页 |
·与邮件作者性别相关的特征分析研究 | 第26-29页 |
·中文电子邮件作者性别特征的提取和表示方法研究 | 第29-35页 |
·中文电子邮件作者性别特征提取方法研究 | 第29-32页 |
·特征表示方法研究 | 第32-34页 |
·特征的选择 | 第34-35页 |
4 基于支持向量机分类算法 | 第35-45页 |
·统计学习理论 | 第35-37页 |
·机器学习 | 第36页 |
·经验风险最小化原理 | 第36页 |
·VC维 | 第36-37页 |
·结构风险最小归纳原理 | 第37页 |
·支持向量机算法原理 | 第37-42页 |
·线性支持向量机 | 第37-39页 |
·非线性支持向量机 | 第39-41页 |
·支持向量机训练算法 | 第41-42页 |
·基于支持向量机的中文电子邮件作者性别识别方法研究 | 第42-45页 |
·邮件作者性别的识别分类方法 | 第42-44页 |
·k分交叉评价 | 第44页 |
·评估方法 | 第44-45页 |
5 研究实验 | 第45-47页 |
·数据集 | 第45页 |
·实验方法 | 第45页 |
·实验结果 | 第45-47页 |
6 结论 | 第47-52页 |
附录A 汉语文本词性标注标记集 | 第52-54页 |
在读期间发表的学术论文 | 第54-55页 |
作者简历 | 第55-56页 |
致谢 | 第56-57页 |
附录 | 第57-61页 |