首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于全局评价的文本分割技术研究

声明第1-5页
摘要第5-6页
Abstract第6-7页
目录第7-10页
第一章 文本分割简介第10-19页
   ·文本分割第10页
   ·文本分割的用途及意义第10-11页
   ·文本分割所涉及的技术第11-12页
   ·文本分割与文本分类的差异第12页
   ·文本的表示第12-13页
   ·文本分割的主要问题第13-15页
     ·段落长短问题第13-14页
     ·体裁问题第14页
     ·子主题跳转问题第14-15页
   ·文本分割的研究现状及发展第15页
   ·文本分割的相关工作第15-17页
     ·TextTiling方法第15页
     ·动态规划方法第15-16页
     ·指数模型第16页
     ·在中文中的文本分割第16页
     ·隐马尔科夫模型(Hidden Markov Model,HMM)方法第16-17页
   ·主要的工作内容第17页
   ·文本的组织结构第17-19页
第二章 类内类间距离方法及其相关理论第19-30页
   ·特征选择与特征选取第19-20页
   ·类别可分离性判据第20-21页
   ·用于可分性判据的类内类间距离第21-23页
   ·聚类简介第23-27页
     ·聚类原理第23-25页
     ·K-means方法介绍第25-27页
   ·类内类间距离方法与聚类方法的异同第27-30页
第三章 数据统计与评价方式第30-40页
   ·试验数据的统计第30-36页
     ·文本分割中的优化问题第30-32页
     ·优化问题的解决方案第32-33页
     ·试验实现及其优缺点第33-35页
     ·试验结果表示第35-36页
   ·试验对比设计第36页
   ·测试样本的选择第36-37页
   ·评价方式第37-40页
     ·F1评价第38页
     ·共现一致概率评价第38-40页
第四章 类内类间距离方法在文本分割中的若干改进第40-57页
   ·TextTiling方法介绍第40-45页
     ·词汇的处理第40-41页
     ·相似度计算第41-42页
     ·边界确定第42-43页
     ·分割数目的确定第43-44页
     ·TextTiling中存在的问题第44-45页
   ·TextTiling在文本分割中的效果第45-46页
   ·原类内类间距离方法在文本分割中的效果第46-48页
   ·类间距离的修正第48-49页
   ·连乘概率的分割间距惩罚第49-52页
   ·基于熵的分割间距惩罚第52-54页
   ·语义段落数目的确定第54-57页
     ·语义段落数目确定的方法和结果第54-55页
     ·TextTiling方法与类内类间距离方法的比较第55-57页
第五章 结束语第57-62页
   ·结论第57页
   ·将来的工作第57-62页
     ·类内类间距离方法的进一步改进第57-58页
     ·优化方法的替代第58-60页
       ·次优解第58-59页
       ·限制信息的引入第59-60页
     ·Fisher线性分析的其他形式第60页
     ·与其他文本分割方法的结合第60-61页
       ·与TextTiling方法的联合第60-61页
       ·与基于规则方法的联合第61页
     ·常规方法的改进第61-62页
       ·距离度量的改进第61页
       ·特征选择的改进第61-62页
参考文献第62-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:金融衍生品相关税收问题研究
下一篇:跨国并购的经济分析