基于二维特征集合的文本计算方法
摘要 | 第1-10页 |
Abstract | 第10-12页 |
第一章 绪论 | 第12-18页 |
·背景、目的和意义 | 第12-13页 |
·国内外研究现状 | 第13-15页 |
·论文的主要工作、创新点和研究意义 | 第15-16页 |
·本文主要工作 | 第15页 |
·本文的主要创新点 | 第15-16页 |
·论文的研究意义 | 第16页 |
·论文的组织结构 | 第16-18页 |
第二章 文本相似性判别概述 | 第18-28页 |
·文本相似度计算的基本概念 | 第18页 |
·文本相似度计算流程 | 第18-21页 |
·文本预处理 | 第19页 |
·文本特征提取 | 第19-20页 |
·文本相似度计算结果评估 | 第20-21页 |
·文本相似度计算的相关技术 | 第21-28页 |
·中文文本分词技术 | 第21-23页 |
·文本特征提取算法 | 第23-25页 |
·文本相似度计算模型 | 第25-28页 |
第三章 二维特征集合概述 | 第28-38页 |
·二维特征集合相关概念 | 第28-30页 |
·二维特征集合的现实意义 | 第29-30页 |
·二维特征集合的存储形式 | 第30-31页 |
·二维特征集合函数群 | 第31-38页 |
·TFIDF | 第32-33页 |
·ITC | 第33页 |
·信息熵 | 第33-34页 |
·文本分布熵 | 第34-35页 |
·段落分布熵 | 第35页 |
·词条分布权值 | 第35-36页 |
·位置因子 | 第36-38页 |
第四章 相关文本风格的分析 | 第38-44页 |
·面向相似度计算的文本风格的定义 | 第38页 |
·文本风格的量化 | 第38-39页 |
·常见文本风格的分析 | 第39-44页 |
·新闻 | 第39-40页 |
·社论 | 第40页 |
·BBS 文本 | 第40-42页 |
·综合杂志 | 第42-43页 |
·论文 | 第43-44页 |
第五章 文本相似度计算方法体系的构建 | 第44-48页 |
·新闻风格文本特征提取算法 | 第44页 |
·BBS 文本的特征提取算法 | 第44-45页 |
·社论文本特征提取算法 | 第45页 |
·综合杂志文本的特征提取算法 | 第45-46页 |
·论文文本特征提取算法 | 第46-48页 |
第六章 基于文本风格的文本相似度计算的研究与实现 | 第48-60页 |
·相似度计算判别系统组成模块 | 第48页 |
·相似度计算流程 | 第48-49页 |
·性能测试与分析 | 第49-52页 |
·系统运行环境 | 第49-50页 |
·实验数据 | 第50页 |
·文本相似度计算方法 | 第50-52页 |
·实验结果评估 | 第52-57页 |
·新闻类文本的实验结果 | 第52-53页 |
·BBS 文本的实验结果 | 第53页 |
·社论文本的实验结果 | 第53-54页 |
·综合杂志文本的实验结果 | 第54-56页 |
·论文文本的实验结果 | 第56-57页 |
·实验结果评估 | 第57-60页 |
第七章 总结和展望 | 第60-62页 |
·全文总结 | 第60页 |
·进一步研究设想 | 第60-61页 |
·心得体会 | 第61-62页 |
参考文献 | 第62-67页 |
致谢 | 第67-69页 |
附录 | 第69页 |