首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

中文邮件语料库建设

第一章 序言第1-13页
   ·课题背景第9-11页
   ·课题研究目标及相关问题第11页
   ·论文的结构第11-13页
第二章 语料库介绍及系统实现框架第13-24页
   ·语料库基础知识第13-17页
     ·概述第13-14页
     ·语料库的加工、管理和规范第14-16页
     ·语料库在语言研究中的应用第16-17页
   ·系统实现框架第17-23页
     ·语料库的细分第17-18页
     ·邮件语料库的管理第18-22页
     ·邮件处理流程第22-23页
   ·本章小结第23-24页
第三章 邮件解析及预处理第24-32页
   ·电子邮件基本知识第24-28页
     ·邮件的格式第24-27页
     ·邮件的传送第27-28页
   ·邮件解析第28-29页
   ·解析后预处理第29-31页
   ·本章小结第31-32页
第四章 邮件分类技术及实现第32-48页
   ·邮件表示模型第32-38页
     ·邮件特征第32-35页
     ·邮件标引第35-36页
     ·特征选择第36-38页
   ·邮件分类方法第38-40页
     ·Rocchio方法—相似度计算方法第38-39页
     ·Naive Bayes—简单贝叶斯方法第39页
     ·Winnow方法第39页
     ·SVM—支持向量机第39-40页
     ·其他第40页
   ·使用最大熵模型进行邮件分类第40-46页
     ·最大熵模型介绍第40-41页
     ·实验及其结果第41-46页
   ·本章小结第46-48页
第五章 邮件聚类技术及实现第48-57页
   ·传统文本聚类方法第48-51页
     ·划分方法(Partitioning Method)第48-49页
     ·层次方法(Hierarchical Method)第49-50页
     ·基于密度的方法(Density-Based Method)第50-51页
   ·基于可到达路径的文本聚类算法第51-56页
     ·相关定义第51-52页
     ·算法描述第52-54页
     ·实验及其结果第54-56页
   ·本章小结第56-57页
第六章 语料库属性及邮件语料添加算法第57-68页
   ·邮件语料库属性分析第57-60页
     ·覆盖度第58-59页
     ·密度第59页
     ·代表度第59-60页
   ·邮件添加算法描述及实现第60-65页
     ·邮件去重算法第61-62页
     ·新语料添加算法第62-65页
   ·实验设置及结果分析第65-67页
   ·本章小结第67-68页
第七章 总结与展望第68-70页
   ·本文总结第68页
   ·未来工作第68-70页
参考文献第70-73页
攻读学位期间公开发表的论文第73-74页
致谢第74-75页
详细摘要第75-77页

论文共77页,点击 下载论文
上一篇:核电站斜坡式堆石堤模型试验及相关问题研究
下一篇:港口工程投标对策及风险控制研究