首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于联合条件熵的文本特征提取算法的研究及其应用

摘要第1-7页
Abstract第7-11页
第一章 绪论第11-16页
   ·文本特征提取研究背景和意义第11-13页
   ·国内外的研究现状第13-14页
   ·本文的研究内容及目的第14页
   ·本文的组织结构第14-16页
第二章 文本特征提取相关技术第16-25页
   ·文本表示形式第16-17页
     ·文本结构第16页
     ·文档特征第16-17页
   ·中文文本特征提取过程第17-18页
   ·文本表示模型第18-21页
     ·向量空间模型第18-19页
     ·扩展布尔逻辑模型第19-20页
     ·概率模型第20-21页
   ·文本特征提取方法第21-23页
     ·TF-IDF函数第21-22页
     ·信息增益(Information Gain)第22-23页
     ·互信息(Mutual Information)第23页
   ·文本的聚类算法第23-25页
第三章 基于联合条件熵的文本特征提取第25-36页
   ·联合熵和条件熵的基本性质第25-26页
   ·基于联合条件熵的文本特征提取第26-30页
     ·特征词的联合熵第26-29页
     ·基于文档频率的条件熵第29页
     ·基于文档频率的特征词的联合条件熵第29-30页
   ·基于联合条件熵的遗传算法第30-36页
     ·遗传算法基本原理第30-32页
     ·基于联合条件熵的遗传算法描述第32-33页
     ·基于联合条件熵的遗传算法运算过程第33-36页
第四章 Web文本数据提取技术第36-44页
   ·Web网页的基本结构和特点第36-38页
     ·HTML结构第36-37页
     ·XML文档结构第37-38页
   ·Web网页数据提取第38-40页
     ·Web数据类型第38页
     ·结构化数据抽取第38-40页
   ·微博数据特点及其抽取第40-44页
     ·微博数据分析第40-41页
     ·微博数据抓取第41-44页
第五章 基于联合条件熵的文本特征提取算法的实验及分析第44-54页
   ·文本数据集建立第45-48页
   ·基于联合条件熵的特征提取第48-51页
   ·k-means聚类第51页
   ·实验结果分析第51-54页
第六章 结论和展望第54-56页
   ·本文工作总结第54-55页
   ·进一步工作展望第55-56页
参考文献第56-60页
致谢第60-61页
附录1:作者攻读硕士学位期间发表的论文第61页

论文共61页,点击 下载论文
上一篇:信号演算的操作语义及其与代数语义的统一
下一篇:生物多样性描述文本的语义标注算法研究