首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉语文本自动分类--市长公开电话数据的统计分析

提要第1-10页
第一章 绪论第10-28页
 §1.1 文本分类的国内外研究现状第10-12页
 §1.2 文本分类的简单介绍第12-15页
 §1.3 常用的几种分类器的介绍第15-18页
 §1.4 文本分类结果的评价方法第18-20页
 §1.5 应用实例简介-市长公开电话第20-25页
  §1.5.1 市长公开电话简介第20-22页
  §1.5.2 市长公开电话流程图第22-23页
  §1.5.3 实行自动文本分类的意义和必要性第23-24页
  §1.5.4 市长公开电话投诉文本的自身特点第24-25页
 §1.6 本文的内容和结构第25-28页
第二章 文本文档的表示第28-40页
 §2.1 汉字的机内码第28-29页
 §2.2 疑难字的输入第29-30页
  §2.2.1 问题的提出第29页
  §2.2.2 解决的方法第29-30页
 §2.3 分词预处理第30-33页
  §2.3.1 基于字典、词库匹配的分词方法第31页
  §2.3.2 基于理解的分词方法第31-32页
  §2.3.3 基于统计的分词方法第32-33页
 §2.4 向量空间模型第33-35页
  §2.4.1 向量空间模型的基本思想第33-34页
  §2.4.2 常用的词条权重表示法第34-35页
 §2.5 市长公开电话文本的表示第35-39页
  §2.5.1 市长公开电话文本的切分第35页
  §2.5.2 获取未登录词的一种方法第35-38页
  §2.5.3 提取投诉数据中的套话第38-39页
 §2.6 小结第39-40页
第三章 特征选择和特征提取第40-56页
 §3.1 特征选择的几种常用方法第40-43页
  §3.1.1 停用词和低频词第40-41页
  §3.1.2 互信息第41-42页
  §3.1.3 优比第42页
  §3.1.4 卡方统计量第42-43页
 §3.2 特征选择在市长公开电话上的应用第43-53页
  §3.2.1 基于卡方统计量的停用词提取第43-50页
  §3.2.2 卡方与优比结合的特征选择方法第50-52页
  §3.2.3 低频词的删除第52-53页
 §3.3 特征抽取第53-54页
  §3.3.1 隐性语义索引第54页
  §3.3.2 词条聚类第54页
 §3.4 小结第54-56页
第四章 汉语文本分类器的设计第56-74页
 §4.1 朴素贝叶斯分类器第56-61页
  §4.1.1 朴素贝叶斯分类器模型第56-57页
  §4.1.2 在市长公开电话上的应用第57-61页
 §4.2 基于多重假设检验的特征加权朴素贝叶斯分类器第61-65页
  §4.2.1 基于多重假设检验的特征加权系数的确定第61-63页
  §4.2.2 在市长公开电话数据集上的应用第63-65页
 §4.3 基于地域信息的文本分类层次结构模型第65-69页
 §4.4 基于分类委员会的文本分类模型第69-71页
 §4.5 基于朴素贝叶斯的多级分类器第71-72页
 §4.6 数据对分类器的性能影响第72-73页
 §4.7 小结第73-74页
第五章 信息综合管理系统控制平台第74-106页
 §5.1 引言第74-75页
 §5.2 平台系统数学模型的构建第75-81页
  §5.2.1 平台系统的数学抽象第76-77页
  §5.2.2 数据集的有序化第77-78页
  §5.2.3 控制集的有序化第78-79页
  §5.2.4 平台系统的构成第79-81页
 §5.3 平台系统的设计原理第81-85页
 §5.4 平台语言的通用指令集第85-90页
  §5.4.1 基础类指令第85-86页
  §5.4.2 数据库类第86页
  §5.4.3 文本操作类第86页
  §5.4.4 网络信息发布类指令第86页
  §5.4.5 多参数数据输入类第86页
  §5.4.6 列表模式第86-87页
  §5.4.7 图文模式第87-88页
  §5.4.8 码表模式第88页
  §5.4.9 Word文档、Excel电子表格模式第88-89页
  §5.4.10 自动化控制第89-90页
 §5.5 平台系统的算法实现第90-92页
 §5.6 平台系统的权限管理与安全机制第92-94页
 §5.7 平台系统指令集的优化第94-97页
  §5.7.1 指令效率分析第94-95页
  §5.7.2 指令集优化后的执行效果第95页
  §5.7.3 平台系统的优缺点第95-97页
 §5.8 平台在市长公开电话中的应用第97-104页
  §5.8.1 市长公开电话受理系统第97-98页
  §5.8.2 全自动单位分类机第98-100页
  §5.8.3 全自动行业分类机第100-101页
  §5.8.4 统计分析系统第101-102页
  §5.8.5 文档自动生成系统第102-103页
  §5.8.6 单位预警预报和行业预警预报第103-104页
 §5.9 小结第104-106页
结论第106-110页
参考文献第110-117页
附录第117-124页
 附录1 平台系统的指令集列表第117-120页
 附录2 疑难汉字速查软件界面(网络版页面)第120页
 附录3 疑难汉字速查软件界面(单机版页面)第120-121页
 附录4 计算机软机著作权登记证书-信息综合管理系统控制平台第121页
 附录5 计算机软机著作权登记证书-疑难汉字速查软件第121-122页
 附录6 分类机工作界面第122页
 附录7 统计分析与预警预报工作界面第122-123页
 附录8 统计分析与预警预报网站界面第123页
 附录9 大屏幕演示控制系统网站界面第123-124页
攻读博士期间发表及待发的学术论文第124-126页
中文摘要第126-134页
ABSTRACT第134-144页
致谢第144页

论文共144页,点击 下载论文
上一篇:二次函数C~1超限插值与曲面拼接
下一篇:虹膜图像恢复算法的研究