基于内容的中文流行病新闻主题分类

摘要	第1-6页
ABSTRACT	第6-10页
第一章序言	第10-22页
·背景介绍	第10-11页
·流行病新闻文本分析	第11-13页
·研究现状及难点分析	第13-20页
·主题分类方法选择	第13-17页
·特征项颗粒选择及权重设置	第17-19页
·数据库局限性	第19-20页
·章节安排	第20-22页
第二章系统介绍	第22-28页
·系统结构框架及任务	第22-23页
·目的	第22页
·系统框架	第22-23页
·RSS新闻抓取器模块	第23-25页
·关于RSS	第23页
·RSS抓取策略	第23-24页
·RSS抓取过程	第24-25页
·HTML文本内容提取模块	第25-26页
·关于HTML	第25页
·几大网站新闻网页分析	第25-26页
·主题分类模块	第26-27页
·本章小结	第27-28页
第三章主题选择	第28-32页
·主题列表	第28-29页
·流行病主题词典	第29-31页
·关于MeSH与ICD-10	第29-30页
·新词发现策略	第30页
·主题词典结构	第30-31页
·本章小结	第31-32页
第四章基于主题词典的主题分类	第32-35页
·拆句	第32页
·分词	第32-34页
·关于分词	第33页
·系统分词算法	第33-34页
·基于主题词典主题定位算法	第34页
·本章小结	第34-35页
第五章基于TextTiling的主题分类	第35-40页
·预处理	第35-36页
·划分token	第36页
·相邻块相似度	第36-37页
·边界划分	第37-38页
·基于TextTiling的主题定位算法	第38-39页
·本章小结	第39-40页
第六章实验结果与分析	第40-44页
·语料库说明	第40页
·实验结果及分析	第40-43页
·本章小结	第43-44页
第七章总结和展望	第44-47页
·系统总结	第44页
·未来工作	第44-46页
·系统框架介绍	第45页
·数据挖掘介绍	第45-46页
·前景展望	第46-47页
参考文献	第47-49页
附录1:MeSH的结构与应用	第49-53页
附录2:ICD-10的结构与应用	第53-56页
附录3:RSS新闻抓取列表	第56-58页
致谢	第58-59页
作者攻读学位期间发表的学术论文目录	第59页