首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于统计与规则的特征权重计算方法研究与应用

摘要第1-9页
Abstract第9-11页
第一章 概述第11-18页
   ·研究背景第11页
   ·研究意义第11-14页
     ·文本分类第11-12页
     ·信息过滤第12页
     ·信息抽取第12-13页
     ·自动文摘第13页
     ·情感分析第13-14页
   ·权重计算方法相关研究第14-16页
     ·特征选择相关研究第14页
     ·VSM 中权重评估函数相关研究第14-15页
     ·文本标引相关研究第15-16页
   ·本文主要工作第16-17页
   ·本文组织结构第17-18页
第二章 文本权重计算第18-32页
   ·已有特征选择算法总结第18-21页
     ·文档频次第18页
     ·互信息第18-19页
     ·χ~2 (CHI ) 统计第19-20页
     ·信息熵第20页
     ·信息增益第20-21页
   ·现有文本表示模型总结第21-24页
     ·布尔模型第21-22页
     ·概率模型第22-23页
     ·信度网模型第23页
     ·向量空间模型第23-24页
   ·已有权重评估函数总结第24-26页
     ·反比文档频数权重第25页
     ·信噪比第25页
     ·TF-IDF第25-26页
   ·权重计算与特征选择的对比第26页
   ·改进信息增益算法第26-31页
     ·信息增益算法分析第26-27页
     ·导致信息增益算法精确度下降的原因第27页
     ·特征项的类间离散度第27-28页
     ·特征项的类内离散度第28页
     ·应用特征项分布信息的信息增益计算方法第28-29页
     ·改进的信息增益算法(IG-GDI)第29页
     ·实验结果分析第29-31页
   ·本章小结第31-32页
第三章 基于统计与规则的特征项权重计算方法第32-51页
   ·问题分析第32-35页
     ·VSM 中特征项粒度选取存在的不足第32-33页
     ·VSM 固有的缺陷分析第33-34页
     ·当前权重计算方法的缺陷第34-35页
   ·VSM 中基于规则的文本表示研究第35-43页
     ·中文组块分析第36页
     ·短语的选取粒度第36-37页
     ·基本短语的识别第37-38页
     ·最大信息熵模型第38-39页
     ·短语特征的权重计算第39-40页
     ·VSM 中特征项关系组织方式第40页
     ·实验结果分析第40-43页
   ·基于统计的特征权重计算方法第43-48页
     ·联合权重计算方法第43-45页
     ·实验及分析第45-48页
   ·基于统计与规则的特征项权重计算方法第48-50页
     ·实验步骤第48页
     ·实验结果分析第48-50页
   ·本章小结第50-51页
第四章 信息过滤系统中基于统计与规则的权重计算方法的应用第51-62页
   ·系统总体设计第51-52页
     ·设计目标第51页
     ·系统逻辑结构第51-52页
   ·系统模块设计第52-56页
     ·数据包截获及解析模块第52-54页
     ·基于遗传算法的模板生成第54页
     ·改进的贝叶斯分类器第54-55页
     ·客户端层次过滤系统模型第55-56页
   ·系统主界面第56-59页
     ·服务器功能及主要界面第56-58页
     ·客户端第58-59页
   ·网络信息过滤效果第59-61页
     ·黑名单过滤效果第59-60页
     ·关键词过滤第60页
     ·高级过滤第60-61页
   ·本章小结第61-62页
第五章 创新点总结与展望第62-64页
   ·创新点总结第62-63页
   ·下一步研究工作第63-64页
参考文献第64-67页
已发表学术论文第67页
参加科研项目第67页
致谢第67-68页

论文共68页,点击 下载论文
上一篇:生态企业竞争策略的优化算法研究
下一篇:基于本体的网络学习资源中图像信息的组织和利用