首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

AntiSpam中全文分词技术的实现与应用研究

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-12页
   ·研究背景概述第8-9页
   ·论文的选题意义第9-10页
   ·课题来源及主要研究内容第10页
     ·课题的来源第10页
     ·主要研究内容第10页
   ·本文的结构第10-12页
第二章 垃圾邮件的由来及技术现状第12-21页
   ·垃圾邮件的产生第12-13页
   ·邮件协议及其漏洞第13-16页
     ·电子邮件的工作原理第13-14页
     ·SMTP协议及漏洞第14-16页
     ·Open Relay第16页
   ·垃圾邮件过滤技术的现状第16-19页
     ·服务器端和客户端的邮件过滤第16-17页
     ·基于IP地址过滤第17-18页
     ·基于信封和信头过滤第18页
     ·基于内容的过滤技术第18-19页
   ·本章小结第19-21页
第三章 汉语词法分析技术综述第21-33页
   ·汉语词法分析第21-31页
     ·汉语词法分析的任务第22页
     ·数据结构:词图(Word Graph)第22-23页
     ·词典查询与重叠词、离合词和前后缀的处理第23页
     ·不考虑未定义词的切分排歧第23-26页
     ·未定义词识别第26-29页
     ·考虑未定义词的切分排歧第29页
     ·词性标注第29-30页
     ·词法分析的流程第30-31页
   ·现有的汉语分词方法第31-33页
第四章 全文分词系统设计与算法第33-51页
   ·相关算法与原理简介第33-35页
     ·隐马尔可夫模型第33-34页
     ·Viterbi算法第34页
     ·贪心(婪)算法第34-35页
     ·大数定理第35页
     ·贝叶斯公式第35页
     ·动态规划第35页
   ·系统总体设计第35-40页
     ·隐马尔可夫模型在分词中的应用第37页
     ·层叠隐马模型和汉语词法分析第37-40页
   ·基于 N-最短路径方法的中文词语粗分模型第40-44页
     ·基本思想第40页
     ·模型求解第40-41页
     ·N-最短路径求解与复杂度分析第41-42页
     ·基于 N-最短路径的统计粗分模型第42-44页
   ·基于角色标注的嵌套未登录词识别第44-49页
     ·简介第44-46页
     ·基于角色标注的中文机构名自动识别方法第46-48页
     ·角色信息的自动抽取第48-49页
     ·自动识别的最终实现第49页
   ·结论第49-51页
第五章 全文分词系统的测试及分析第51-60页
   ·汉语自动分词的难点第51页
   ·分词系统性能评价第51-52页
   ·训练语料库的选择第52-54页
   ·实验与分析第54-58页
     ·系统集成测试第54-56页
     ·粗分模型测试第56-58页
   ·语料库加工的标记实例第58-60页
第六章 总结与展望第60-61页
   ·研究结论第60页
   ·研究展望第60-61页
致谢第61-62页
参考文献第62-64页
攻读硕士学位期间发表论文情况第64页

论文共64页,点击 下载论文
上一篇:基于人工神经网络的教育评价方法研究
下一篇:基于Web的实验室管理信息系统