中文邮件语料库建设

第一章序言	第1-13页
·课题背景	第9-11页
·课题研究目标及相关问题	第11页
·论文的结构	第11-13页
第二章语料库介绍及系统实现框架	第13-24页
·语料库基础知识	第13-17页
·概述	第13-14页
·语料库的加工、管理和规范	第14-16页
·语料库在语言研究中的应用	第16-17页
·系统实现框架	第17-23页
·语料库的细分	第17-18页
·邮件语料库的管理	第18-22页
·邮件处理流程	第22-23页
·本章小结	第23-24页
第三章邮件解析及预处理	第24-32页
·电子邮件基本知识	第24-28页
·邮件的格式	第24-27页
·邮件的传送	第27-28页
·邮件解析	第28-29页
·解析后预处理	第29-31页
·本章小结	第31-32页
第四章邮件分类技术及实现	第32-48页
·邮件表示模型	第32-38页
·邮件特征	第32-35页
·邮件标引	第35-36页
·特征选择	第36-38页
·邮件分类方法	第38-40页
·Rocchio方法—相似度计算方法	第38-39页
·Naive Bayes—简单贝叶斯方法	第39页
·Winnow方法	第39页
·SVM—支持向量机	第39-40页
·其他	第40页
·使用最大熵模型进行邮件分类	第40-46页
·最大熵模型介绍	第40-41页
·实验及其结果	第41-46页
·本章小结	第46-48页
第五章邮件聚类技术及实现	第48-57页
·传统文本聚类方法	第48-51页
·划分方法（Partitioning Method）	第48-49页
·层次方法（Hierarchical Method）	第49-50页
·基于密度的方法（Density-Based Method）	第50-51页
·基于可到达路径的文本聚类算法	第51-56页
·相关定义	第51-52页
·算法描述	第52-54页
·实验及其结果	第54-56页
·本章小结	第56-57页
第六章语料库属性及邮件语料添加算法	第57-68页
·邮件语料库属性分析	第57-60页
·覆盖度	第58-59页
·密度	第59页
·代表度	第59-60页
·邮件添加算法描述及实现	第60-65页
·邮件去重算法	第61-62页
·新语料添加算法	第62-65页
·实验设置及结果分析	第65-67页
·本章小结	第67-68页
第七章总结与展望	第68-70页
·本文总结	第68页
·未来工作	第68-70页
参考文献	第70-73页
攻读学位期间公开发表的论文	第73-74页
致谢	第74-75页
详细摘要	第75-77页