电子邮件文档中维、英、汉文种识别技术研究与实现

摘要	第1-4页
Abstract	第4-8页
第一章绪论	第8-12页
·论文的研究背景及选题	第8页
·国内外研究现状与分析	第8-10页
·论文研究的主要内容	第10页
·论文各章节的安排	第10-12页
第二章相关技术概述	第12-22页
·RFC822 邮件格式	第12-13页
·MIME 协议邮件格式	第13-18页
·MIME 邮件的组织结构	第14-16页
·MIME 邮件的编码方式	第16-18页
·维吾尔文的特点	第18-20页
·维吾尔文老文字	第18-19页
·维吾尔文新文字	第19-20页
·维吾尔文字的编码特点	第20页
·本章小结	第20-22页
第三章电子邮件文档文种识别系统需求分析	第22-30页
·信访邮件系统需求分析	第22-25页
·系统组成	第23页
·系统功能	第23-25页
·电子邮件文档文种识别系统需求分析	第25-28页
·用户特征调查	第25-26页
·新疆少数民族文字在互联网上的应用情况	第26页
·系统目标	第26-27页
·系统功能需求	第27-28页
·系统性能需求	第28页
·本章小结	第28-30页
第四章电子邮件文档文种识别系统关键技术分析与设计	第30-44页
·电子邮件文档中维英汉等文种识别的难点分析	第30-31页
·字典驱动的识别方案设计	第31-32页
·功能模块设计	第32-33页
·汉字常用码制识别算法	第33-34页
·N-Gram 及其在汉字编码识别中的应用	第34-37页
·N-Gram 模型	第34页
·Uni-Gram 在编码识别中的应用	第34-35页
·编码识别过程	第35-36页
·索引方式	第36-37页
·性能分析	第37页
·基于贝叶斯分类识别方法	第37-41页
·基于码制可行度的识别方法	第41页
·汉字识别方案的选择	第41-42页
·本章小结	第42-44页
第五章电子邮件文档文种识别系统详细设计与实现	第44-64页
·构建符合互联网应用的新维文语料库和字典	第44-55页
·新维文语料的采集处理过程	第44-46页
·项目初期的新维文语料采集工作	第46-47页
·新维文语料库和字典数据库设计	第47-49页
·基于新维文语料库创建新维文字典	第49页
·对新维文字典查询分析	第49-55页
·创建英文字典	第55页
·电子邮件文档中维英汉文种识别设计与实现	第55-61页
·邮件体中邮件正文的提取	第55-56页
·邮件正文的解码	第56页
·邮件正文部分的清洗	第56-57页
·邮件正文字符串的分解	第57-58页
·新维文、英文的识别	第58-59页
·汉字识别和阿拉伯文字母转换及老维文的识别	第59-60页
·确定文档文本识别结果	第60-61页
·系统应用情况	第61-63页
·系统运行情况	第61-63页
·工作效益和推广情况	第63页
·本章小结	第63-64页
第六章总结与展望	第64-66页
致谢	第66-68页
参考文献	第68-70页