首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于分布式系统的N元文法模型研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-11页
   ·研究的背景和意义第7页
   ·研究现状和难点第7-8页
     ·语言模型的研究现状第7-8页
     ·语言模型面临的难点第8页
   ·本文研究内容第8-11页
     ·论文的研究思路第8-9页
     ·论文的组织第9-11页
第二章 分布式语言模型的建模框架第11-19页
   ·Hadoop 分布式文件系统 HDFS第11-14页
     ·系统设计的前提和目标第11-12页
     ·名称节点和数据节点第12-14页
   ·Hadoop MapReduce 计算框架第14-15页
   ·Hbase 数据库第15-19页
     ·Hbase 概念视图第15-16页
     ·Hbase 物理视图第16-19页
第三章 统计语言模型和平滑算法第19-29页
   ·统计语言模型概述第19-20页
   ·现有的主要统计语言模型第20-23页
     ·上下文无关模型第20页
     ·N 元文法模型第20-21页
     ·N-pos 模型第21-22页
     ·基于决策树的语言模型第22-23页
     ·动态、自适应、基于缓存的语言模型第23页
   ·数据平滑技术第23-24页
   ·常见的数据平滑技术第24-28页
     ·加法平滑第24页
     ·Good-Turing 平滑第24-25页
     ·线性插值平滑第25页
     ·回退平滑第25-27页
     ·Kneser-Ney 平滑第27页
     ·Witten-Bell 平滑第27-28页
   ·数据平滑算法的评价标准第28-29页
第四章 基于 MapReduce 的语言模型估算及评估方法第29-49页
   ·生成单词数目第30-32页
   ·统计出现 r 次的 n 元词组个数 Nr第32-33页
   ·Nr 的 Good-Turing 平滑第33-35页
   ·计算 n 元词组的概率第35-37页
   ·建立 Hbase 表第37-42页
     ·基于 n 元词组的表结构第37页
     ·基于当前词的表结构第37-38页
     ·基于上下文的表结构第38-39页
     ·基于 n/2 元词组的表结构第39-40页
     ·基于整数的表结构第40-42页
   ·直接查询第42-44页
   ·缓存查询第44-46页
   ·方法的评估第46-49页
     ·建立语言模型的时间和空间第47页
     ·语言模型的迷惑度比较第47-49页
第五章 实验方案及结果分析第49-59页
   ·实验数据第49-50页
   ·N 元文法模型阶数第50-53页
   ·各种表结构的数据对比第53-59页
第六章 总结与展望第59-61页
   ·实验总结第59-60页
   ·未来工作展望第60-61页
致谢第61-63页
参考文献第63-66页

论文共66页,点击 下载论文
上一篇:MVC设计模式在BREW应用中的研究与实现
下一篇:面向企业竞争情报的Web文本挖掘技术研究