首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于统计语言模型的汉语浅层分析研究

摘要第1-5页
Abstract第5-7页
目录第7-10页
1 绪论第10-27页
   ·研究背景和意义第10-12页
     ·研究背景第10-12页
     ·研究意义第12页
   ·自然语言处理的基本方法第12-14页
   ·国内外研究概况第14-25页
     ·新词识别研究概况第14-16页
     ·命名实体识别研究概况第16-21页
     ·组块分析研究概况第21-25页
   ·本文主要工作和内容组织第25-27页
     ·本文主要工作第25-26页
     ·本文内容组织第26-27页
2 统计语言模型第27-43页
   ·N-gram模型第27-29页
     ·N-gram模型介绍第27-28页
     ·数据平滑方法第28-29页
   ·隐马尔科夫模型第29-31页
   ·最大熵模型第31-34页
     ·最大熵模型介绍第31-33页
     ·最大熵原理的数学表示第33-34页
   ·支持向量机第34-37页
     ·最优分类超平面第35-36页
     ·核函数第36-37页
     ·多分类问题第37页
   ·Boosting算法第37-38页
   ·条件随机域第38-43页
     ·无向图模型第38-39页
     ·条件随机域的图结构第39-40页
     ·条件随机域的势函数表示第40-43页
3 基于互信息与串频统计的新词识别第43-54页
   ·新词的定义和特征第43-44页
     ·新词的定义第43页
     ·新词的特征第43-44页
   ·互信息基本理论第44-48页
     ·随机变量及其特征第44-45页
     ·熵、联合熵和条件熵第45-47页
     ·互信息第47-48页
   ·基于互信息和串频统计的新词识别第48-54页
     ·潜在新词串第48-49页
     ·新词识别第49-52页
     ·实验结果第52-54页
4 基于有向图模型与分词一体化的命名实体识别第54-78页
   ·基于有向图的语言模型第54-64页
     ·分词有向图的建立第54-55页
     ·有向图中边的权值第55-56页
     ·正确切分路径的选择第56-64页
   ·与分词一体化的中国人名识别第64-68页
     ·中国人名的构成特点第64-65页
     ·候选中国人名的生成第65-66页
     ·中国人名的识别第66-68页
   ·与分词一体化的中国地名识别第68-73页
     ·词语级中国地名的特征第68-69页
     ·候选地名的生成第69-70页
     ·中国地名的识别第70-73页
   ·与分词一体化的外国译名识别第73-78页
     ·外国译名的构成第74页
     ·候选外国译名的生成第74-76页
     ·外国译名识别第76-78页
5 基于DR-AdaBoost算法的汉语组块分析第78-103页
   ·汉语组块的定义第78-85页
     ·组块的定义第78-80页
     ·组块的类型第80-85页
   ·组块的标注形式和评测方法第85-87页
     ·组块的标注形式第85-86页
     ·组块分析结果的评测方法第86-87页
   ·基于有向图模型的汉语组块分析第87-91页
     ·组块分析有向图第87-88页
     ·有向边权值计算和路径选择第88-90页
     ·实验结果第90-91页
   ·基于DR-AdaBoost的汉语组块分析第91-103页
     ·Boosting与AdaBoost算法简介第91-93页
     ·改进的AdaBoost算法:DR-AdaBoost第93-97页
     ·DR-AdaBoost在UCI数据集上的测试第97-99页
     ·DR-AdaBoost在CoNLL-2000共享数据集上的测试第99-100页
     ·基于DR-AdaBoost的汉语组块分析第100-103页
6 总结与展望第103-105页
参考文献第105-120页
创新点摘要第120-121页
攻读博士学位期间发表学术论文情况第121-122页
致谢第122-124页

论文共124页,点击 下载论文
上一篇:档案信息化建设现状与发展对策研究--以江苏为例
下一篇:中国降水异常分布的非线性特征及夏季降水与东亚夏季风的非线性关系