首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于分类文本库的文本分类系统的应用研究及实现

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-15页
   ·研究背景和意义第9-11页
     ·研究背景第9-10页
     ·研究意义第10-11页
   ·研究现状第11-12页
   ·课题的提出第12页
   ·课题的主要工作第12-13页
   ·论文组织结构第13-15页
第二章 文本分类系统的总体设计第15-23页
   ·系统总体设计第15-19页
   ·系统功能结构第19-20页
     ·权限管理功能第19-20页
     ·系统训练功能第20页
     ·文档分类功能第20页
   ·系统用例分析第20-21页
     ·角色定义第20-21页
     ·用例分析第21页
   ·本章小结第21-23页
第三章 关键技术第23-39页
   ·文档表示技术第23-25页
   ·中文分词技术第25-31页
     ·基于字符串匹配的分词方法第25-26页
     ·基于理解的分词方法第26-27页
     ·基于统计的分词方法第27页
     ·中文分词难点第27-28页
     ·中科院的分词词典技术第28-31页
   ·特征项选取第31-35页
     ·文档频率法(DF)第31-32页
     ·信息增益方法第32-33页
     ·开方检验法(CHI)第33-34页
     ·互信息法(MI)第34页
     ·小结第34-35页
   ·特殊数据处理第35页
   ·贝叶斯模型简介第35-36页
   ·本章小结第36-39页
第四章 系统的详细设计第39-67页
   ·用户登录模块设计第39-40页
   ·文本格式转换模块设计第40-58页
     ·html/htm 格式文件转换成txt 格式第40-44页
     ·word 格式文件转换成txt 格式第44-50页
     ·pdf 格式文件转换成txt 格式第50-58页
   ·系统训练模块设计第58-61页
     ·训练流程设计第58-59页
     ·去停用词及词组信息统计设计第59-60页
     ·特征项选取及存储设计第60-61页
     ·训练模块总结第61页
   ·文本分类系统分类模块设计第61-64页
     ·文档分类处理过程第61-62页
     ·文档分别属于各类别的概率计算第62页
     ·概率计算流程第62-63页
     ·文档类别归属设计第63-64页
   ·数据结构设计第64-65页
   ·实现工具选取第65页
   ·本章小结第65-67页
第五章 系统的具体实现及效果测试第67-79页
   ·数据库的设计第67页
   ·系统功能模块的实现第67-73页
     ·用户登录模块的实现第67-69页
     ·训练模块的实现第69-71页
     ·分类模块的实现第71-73页
   ·文档格式转换程序测试第73-76页
   ·训练及分类模块程序测试第76-77页
   ·本章小结第77-79页
第六章 结论第79-81页
致谢第81-82页
参考文献第82-84页
个人简历第84页

论文共84页,点击 下载论文
上一篇:基于数据挖掘技术实现骚扰电话识别
下一篇:AGRS系统管理设计与实现