首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本相似性度量中参数相关性与优化配置研究

摘要第1-5页
ABSTRACT第5-6页
目录第6-9页
第一章 绪论第9-12页
   ·文本研究意义及背景第9页
   ·国内外研究现状第9-11页
   ·本文研究内容及组织结构第11-12页
第二章 文本相似性度量概述第12-35页
   ·文本相似性度量基本概念第12-16页
     ·文本相似性度量的作用第12-13页
     ·中文文本相似性度量的一般实现过程第13-14页
     ·文本相似性度量性能评估第14-16页
   ·中文文本分词第16-20页
     ·中文文本的特点第16页
     ·中文分词的原则规范第16-17页
     ·中文分词方法的分析及比较第17-20页
   ·文本相似性度量关键技术分析第20-33页
     ·文本数学表示模型第20-26页
     ·文本特征表示第26-27页
     ·文本特征选择第27-30页
     ·文本特征权重的计算第30-33页
   ·文本相似性度量化计算第33-34页
     ·相同特征数量统计第33-34页
     ·余弦相似度计算第34页
   ·小结第34-35页
第三章 典型文本相似性度量算法的实现及比较分析第35-55页
   ·基于特征向量的文本相似性度量算法第36-40页
     ·VSM文本表示第36-37页
     ·算法的基本思路第37-39页
     ·基于VSM算法描述第39-40页
   ·基于shingle的文本相似性度量算法第40-46页
     ·算法的基本思路第41-42页
     ·基于滑动窗口机制的shingle生成方法第42-43页
     ·基于shingle权重的抽取策略第43-44页
     ·改进的相似度计算第44-45页
     ·Shingling算法描述第45-46页
   ·两种文本相似性度量算法的实验与结果第46-51页
     ·实验数据来源第46-47页
     ·实验步骤第47页
     ·实验结果第47-51页
   ·两种文本相似性度量算法的比较分析第51-54页
     ·准确率和召回率比较第51-52页
     ·F-Measure平衡系数比较第52-53页
     ·运行效率比较第53页
     ·实际应用比较第53-54页
   ·小结第54-55页
第四章 文本相似性度量中参数相关性的分析第55-68页
   ·Shingling算法中各参数概述第55-57页
     ·文本属性第55-56页
     ·Shingle滑动窗口大小第56页
     ·Shingle权重门限第56页
     ·Shingle抽取率第56页
     ·相似度阈值第56-57页
   ·文本集合属性分析第57-59页
     ·文本内容格式第57页
     ·文本集合中文本篇幅的分布第57-58页
     ·文本相似特征分析第58页
     ·文本集合空间的扩展性分析第58-59页
   ·文本属性和滑动窗口大小分析第59-61页
     ·文本篇幅属性-滑动窗口大小第59-60页
     ·文本相似特征属性-滑动窗口大小第60页
     ·Shingle滑动窗口大小-准确率分析第60-61页
   ·Shingle权重门限分析第61-62页
     ·文本篇幅属性-shingle权重门限第61-62页
     ·Shingle抽取率-shingle权重门限第62页
     ·Shingle权重门限-准确率分析第62页
   ·相似度阈值、准确率和召回率分析第62-65页
     ·相似度阈值分析第62-63页
     ·文本篇幅属性-相似度阈值-准确率第63-64页
     ·文本篇幅属性-相似度阈值-召回率第64-65页
   ·准确率、召回率和F-Measure平衡系数第65-67页
     ·准确率-召回率分析第65-66页
     ·F-Measure平衡系数分析第66-67页
   ·小结第67-68页
第五章 文本相似性度量中各参数的优化配置第68-77页
   ·滑动窗口大小的动态性第68-70页
     ·动态滑动窗口机制第68-69页
     ·滑动窗口大小动态性的实现第69-70页
   ·Shingle权重门限的自反馈第70-72页
     ·Shingle权重门限的自反馈机理第70-71页
     ·Shingle权重门限自反馈的实现第71-72页
   ·相似度阈值自动适应化第72-73页
     ·相似度阈值自动适应化原理第72-73页
     ·相似度阈值自动适应化参数训练第73页
   ·各参数可优化配置的简单应用第73-76页
     ·各参数可优化配置的应用框架第74页
     ·相似度阈值等参数可优化配置的算法第74-76页
   ·小结第76-77页
第六章 总结与展望第77-79页
   ·本文的主要工作第77-78页
   ·进一步的工作第78-79页
参考文献第79-84页
致谢第84-85页
攻读硕士学位期间参与项目及发表论文第85页

论文共85页,点击 下载论文
上一篇:XML数据编码与小枝模式查询的研究
下一篇:面向EPON系统的自动测试软件的设计与实现