首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于内容的中文流行病新闻主题分类

摘要第1-6页
ABSTRACT第6-10页
第一章 序言第10-22页
   ·背景介绍第10-11页
   ·流行病新闻文本分析第11-13页
   ·研究现状及难点分析第13-20页
     ·主题分类方法选择第13-17页
     ·特征项颗粒选择及权重设置第17-19页
     ·数据库局限性第19-20页
   ·章节安排第20-22页
第二章 系统介绍第22-28页
   ·系统结构框架及任务第22-23页
     ·目的第22页
     ·系统框架第22-23页
   ·RSS新闻抓取器模块第23-25页
     ·关于RSS第23页
     ·RSS抓取策略第23-24页
     ·RSS抓取过程第24-25页
   ·HTML文本内容提取模块第25-26页
     ·关于HTML第25页
     ·几大网站新闻网页分析第25-26页
   ·主题分类模块第26-27页
   ·本章小结第27-28页
第三章 主题选择第28-32页
   ·主题列表第28-29页
   ·流行病主题词典第29-31页
     ·关于MeSH与ICD-10第29-30页
     ·新词发现策略第30页
     ·主题词典结构第30-31页
   ·本章小结第31-32页
第四章 基于主题词典的主题分类第32-35页
   ·拆句第32页
   ·分词第32-34页
     ·关于分词第33页
     ·系统分词算法第33-34页
   ·基于主题词典主题定位算法第34页
   ·本章小结第34-35页
第五章 基于TextTiling的主题分类第35-40页
   ·预处理第35-36页
   ·划分token第36页
   ·相邻块相似度第36-37页
   ·边界划分第37-38页
   ·基于TextTiling的主题定位算法第38-39页
   ·本章小结第39-40页
第六章 实验结果与分析第40-44页
   ·语料库说明第40页
   ·实验结果及分析第40-43页
   ·本章小结第43-44页
第七章 总结和展望第44-47页
   ·系统总结第44页
   ·未来工作第44-46页
     ·系统框架介绍第45页
     ·数据挖掘介绍第45-46页
   ·前景展望第46-47页
参考文献第47-49页
附录1:MeSH的结构与应用第49-53页
附录2:ICD-10的结构与应用第53-56页
附录3:RSS新闻抓取列表第56-58页
致谢第58-59页
作者攻读学位期间发表的学术论文目录第59页

论文共59页,点击 下载论文
上一篇:基于SSH的粮食储藏实验信息管理系统的设计与实现
下一篇:基于语用信息的中文专利检索系统