首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

适应于不同领域的中文分词方法研究与实现

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-31页
   ·研究背景及意义第11页
   ·国内外研究现状第11-20页
     ·机械+规则方法第11-13页
     ·统计方法第13-20页
   ·关键问题第20-22页
     ·歧义切分第20-21页
     ·未登录词第21-22页
   ·语料资源第22-24页
     ·常用语料资源第22-23页
     ·语料中存在的问题第23-24页
   ·评测第24-28页
     ·测试类型第25页
     ·评价指标第25-26页
     ·评测数据第26-27页
     ·评测小结第27-28页
   ·常用中文分词工具第28-29页
   ·研究内容及安排第29-31页
第2章 字序列标注分词方法调研第31-43页
   ·机器学习模型第31-37页
     ·生成模型与判别模型第31-32页
     ·中文分词常用模型对比第32-37页
   ·特征选择对分词结果的影响第37-40页
     ·实验语料第38页
     ·特征模板与标注集合第38-39页
     ·实验结果及分析第39-40页
   ·本章小结第40-43页
第3章 基于“固结词串”的普通领域分词歧义消解第43-53页
   ·基于 CRF 模型中文分词方法存在的问题第43-45页
   ·固结词串第45-46页
   ·固结词第46页
   ·分词策略第46-47页
   ·实验第47-51页
     ·实验语料与设置第47-49页
     ·实验结果与分析第49-51页
   ·CRF 与固结词串结合第51页
   ·本章小结第51-53页
第4章 语料特征适合度第53-69页
   ·OOV 的质第53-54页
   ·基本元素特征适合度第54-55页
   ·总体特征适合度和相对适合度第55-56页
     ·总体对称特征适合度第55页
     ·总体相对特征适合度第55-56页
   ·使用方式第56页
   ·实验语料与设置第56-59页
     ·基础语料第56-57页
     ·语料扩展第57-58页
     ·实验设置第58-59页
   ·实验结果与分析第59-67页
     ·单一训练语料第59-61页
     ·平衡训练语料第61-67页
   ·基于机器学习的中文分方法的局限性第67页
   ·本章小结第67-69页
第5章 语料规模对分词结果的影响第69-101页
   ·统一 OOV 与分词歧义比率测量方法第69-71页
   ·测试语料规模对分词结果的影响第71-81页
     ·实验语料与设置第71-73页
     ·实验结果与分析第73-81页
   ·训练语料规模对分词结果的影响第81-88页
     ·非同质训练语料第81-82页
     ·同质训练语料第82-88页
   ·OOV 与分词歧义的关系及影响第88-99页
     ·词表的重要性第88-89页
     ·词表的获取优势第89页
     ·词表扩充对 OOV 与分词歧义的影响第89-99页
   ·本章小结第99-101页
第6章 词表与统计结合的专业领域 OOV 识别方法第101-121页
   ·专业领域分词相关工作第101-102页
   ·实验语料第102-103页
   ·词表与 CRF 方法相结合第103-114页
     ·训练语料候选句子评价标准第104页
     ·字符串分类第104-107页
     ·基于子串的分词方法第107-109页
     ·新词过滤与后处理第109-110页
     ·实验设置与结果分析第110-114页
   ·词表与 NVBE 方法相结合第114-120页
     ·无监督学习方法考察第115-116页
     ·结合方式第116-117页
     ·实验设置及结果分析第117-120页
   ·本章小结第120-121页
第7章 无监督专业领域分词歧义消解方法第121-133页
   ·专业领域分词歧义分析第121-123页
     ·专业领域分词歧义与通用领域分词歧义区别第121-122页
     ·专业领域分词歧义主要解决的问题第122-123页
     ·最大交搭歧义链的选择第123页
   ·无监督的专业领域分词歧义消解方法第123-127页
     ·字符串频次第124-125页
     ·互信息第125页
     ·边界熵第125-127页
   ·实验第127-132页
     ·实验语料与设置第127-128页
     ·实验结果与分析第128-132页
   ·本章小结第132-133页
结论第133-137页
参考文献第137-147页
攻读博士学位期间发表的学术论文第147-148页
致谢第148-149页

论文共149页,点击 下载论文
上一篇:基于压缩感知的图像编解码方法研究
下一篇:链接数据网构建的关键问题研究