首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于SVM的中文电子邮件作者身份挖掘技术研究

1 引言第1-14页
   ·问题的提出第7-9页
   ·可行性研究第9页
   ·相关研究第9-13页
     ·作品风格学(stylometry)和身份分析第9-10页
     ·身份分析发展的历史和现状第10-12页
     ·邮件作者身份分析的国内外研究现状第12-13页
   ·本文的主要工作第13-14页
2 数据挖掘原理及技术第14-26页
   ·数据挖掘概述第14-17页
     ·数据挖掘的产生背景第14页
     ·数据挖掘的概念第14页
     ·数据挖掘与知识发现第14-15页
     ·数据挖掘的过程第15-16页
     ·数据挖掘技术分析第16-17页
   ·数据挖掘方法及工具第17-20页
     ·神经网络技术第17-18页
     ·决策树第18-19页
     ·遗传算法第19页
     ·粗糙集第19-20页
     ·支持向量机第20页
   ·文本挖掘技术第20-21页
   ·自动文本分类技术第21-26页
     ·文本信息的预处理第22页
     ·文本的特征表示和特征提取第22-23页
     ·特征匹配与分类第23-26页
3 支持向量机分类算法第26-36页
   ·统计学习理论第26-28页
     ·机器学习第26-27页
     ·经验风险最小化原理第27页
     ·VC维第27页
     ·结构风险最小归纳原理第27-28页
   ·支持向量机算法原理第28-34页
     ·线性支持向量机第28-30页
     ·非线性支持向量机第30-32页
     ·支持向量机训练算法第32-34页
   ·支持向量机多类分类第34-36页
4 邮件作者身份挖掘技术研究第36-49页
   ·电子邮件的特点第36-37页
     ·电子邮件的工作原理第36页
     ·电子邮件的头信息第36-37页
     ·邮件文档的特点第37页
   ·邮件作者身份分类过程第37-39页
   ·关键问题处理技术第39-47页
     ·中文自动分词第39-40页
     ·邮件文档的向量空间模型第40-41页
     ·邮件向量的提取第41-44页
     ·邮件作者身份分类的设计第44-45页
     ·k分交叉评价第45-46页
     ·评估方法第46-47页
   ·邮件作者身份挖掘研究实验第47-49页
     ·数据集第47页
     ·实验方法第47页
     ·实验结果第47-49页
5 结论与展望第49-51页
   ·本文所得的结论第49页
   ·进一步研究的方向第49-51页
参考文献第51-59页
附录A 标准邮件的头部代码第59-60页
附录B 原始邮件文档预处理后的格式第60-61页
附录C 切分后的电子邮件格式第61-62页
附录D LIBSVM-2.5输入数据格式第62-63页
附录E 邮件语言特征的特征词第63-64页
在读期间发表的学术论文第64-70页
作者简历第70-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:酷刑的法哲学思考
下一篇:现代新儒学伦理道德思想与现代道德教育