基于全局评价的文本分割技术研究

声明	第1-5页
摘要	第5-6页
Abstract	第6-7页
目录	第7-10页
第一章文本分割简介	第10-19页
·文本分割	第10页
·文本分割的用途及意义	第10-11页
·文本分割所涉及的技术	第11-12页
·文本分割与文本分类的差异	第12页
·文本的表示	第12-13页
·文本分割的主要问题	第13-15页
·段落长短问题	第13-14页
·体裁问题	第14页
·子主题跳转问题	第14-15页
·文本分割的研究现状及发展	第15页
·文本分割的相关工作	第15-17页
·TextTiling方法	第15页
·动态规划方法	第15-16页
·指数模型	第16页
·在中文中的文本分割	第16页
·隐马尔科夫模型(Hidden Markov Model，HMM)方法	第16-17页
·主要的工作内容	第17页
·文本的组织结构	第17-19页
第二章类内类间距离方法及其相关理论	第19-30页
·特征选择与特征选取	第19-20页
·类别可分离性判据	第20-21页
·用于可分性判据的类内类间距离	第21-23页
·聚类简介	第23-27页
·聚类原理	第23-25页
·K-means方法介绍	第25-27页
·类内类间距离方法与聚类方法的异同	第27-30页
第三章数据统计与评价方式	第30-40页
·试验数据的统计	第30-36页
·文本分割中的优化问题	第30-32页
·优化问题的解决方案	第32-33页
·试验实现及其优缺点	第33-35页
·试验结果表示	第35-36页
·试验对比设计	第36页
·测试样本的选择	第36-37页
·评价方式	第37-40页
·F1评价	第38页
·共现一致概率评价	第38-40页
第四章类内类间距离方法在文本分割中的若干改进	第40-57页
·TextTiling方法介绍	第40-45页
·词汇的处理	第40-41页
·相似度计算	第41-42页
·边界确定	第42-43页
·分割数目的确定	第43-44页
·TextTiling中存在的问题	第44-45页
·TextTiling在文本分割中的效果	第45-46页
·原类内类间距离方法在文本分割中的效果	第46-48页
·类间距离的修正	第48-49页
·连乘概率的分割间距惩罚	第49-52页
·基于熵的分割间距惩罚	第52-54页
·语义段落数目的确定	第54-57页
·语义段落数目确定的方法和结果	第54-55页
·TextTiling方法与类内类间距离方法的比较	第55-57页
第五章结束语	第57-62页
·结论	第57页
·将来的工作	第57-62页
·类内类间距离方法的进一步改进	第57-58页
·优化方法的替代	第58-60页
·次优解	第58-59页
·限制信息的引入	第59-60页
·Fisher线性分析的其他形式	第60页
·与其他文本分割方法的结合	第60-61页
·与TextTiling方法的联合	第60-61页
·与基于规则方法的联合	第61页
·常规方法的改进	第61-62页
·距离度量的改进	第61页
·特征选择的改进	第61-62页
参考文献	第62-64页
致谢	第64页