首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语言模型的文本分割研究

摘要第1-6页
ABSTRACT第6-8页
目录第8-11页
第一章 绪论第11-19页
   ·文本分割的研究意义第11页
   ·文本分割的研究现状第11-13页
     ·基于词汇聚的思想第12-13页
     ·基于统计的思想第13页
     ·基于语言特征的思想第13页
   ·文本分割与文本分类的差异第13-14页
   ·文本分割的主要问题第14-15页
     ·段落长短问题第14-15页
     ·体裁问题第15页
     ·子主题边界问题第15页
   ·文本分割的评价方法第15-17页
   ·本文主要研究内容第17-18页
   ·本文组织结构第18页
   ·本章小结第18-19页
第二章 语言模型技术分析第19-27页
   ·语言模型概述第19-22页
     ·语言模型分类第19页
     ·文法型语言模型第19-20页
     ·统计型语言模型第20-22页
   ·统计语言模型的应用第22-23页
   ·语言模型的优劣分析第23-26页
     ·隐马尔科夫模型第23-24页
     ·最大熵模型第24-25页
     ·N-gram 模型第25-26页
   ·基于关联矩阵的 Bigram 语言模型第26页
   ·本章小结第26-27页
第三章 基于改进的 Bigram 模型的特征提取方法第27-36页
   ·文本特征提取过程第27-28页
   ·常用的文本特征提取方法第28-29页
     ·文本频数第28页
     ·互信息第28页
     ·χ2统计第28-29页
   ·基于改进的 Bigram 模型框架说明第29-30页
   ·文本切分第30-32页
     ·文本粗切分第30页
     ·Bigram 切分第30-32页
   ·关联矩阵第32-33页
   ·合并特征向量第33页
   ·数据稀疏与平滑处理第33-35页
   ·本章小结第35-36页
第四章 基于 Dotplotting 的文本边界搜索策略第36-42页
   ·Dotplotting 概述第36-37页
   ·传统 Dotplotting 算法存在的问题第37-39页
     ·密度函数不对称第37-39页
     ·已识别边界的制约第39页
     ·段间与段内相似度第39页
   ·Dotplotting 密度函数的研究与改进第39-41页
     ·密度评价函数第39-40页
     ·分割点搜索策略第40页
     ·段落长度因子第40-41页
   ·本章小结第41-42页
第五章 实验结果与分析第42-50页
   ·评测语料介绍第42-44页
     ·真实文本第42页
     ·合成文本第42-43页
     ·语料的选择第43-44页
   ·实验介绍与结果分析第44-50页
     ·文本特征提取对比实验第44-45页
     ·文本分割对比实验第45-50页
第六章 总结与展望第50-52页
   ·工作总结第50页
   ·工作展望第50-52页
致谢第52-53页
参考文献第53-57页
附录第57-58页
详细摘要第58-60页

论文共60页,点击 下载论文
上一篇:基于并行编程的轮对图像在线处理算法优化技术研究
下一篇:密文域下图像认证技术研究