面向藏文WEB热点事件发现系统的设计

中文摘要	第1-3页
Abstract	第3-7页
第一章绪论	第7-11页
·课题背景和来源	第7页
·TDT相关介绍	第7-9页
·国内外研究现状	第9-10页
·本课题研究意义	第10页
·本文主要研究内容	第10页
·论文的组织	第10-11页
第二章总体设计与系统流程图	第11-13页
·设计思路	第11页
·系统流程图	第11-12页
·本章小节	第12-13页
第三章热点事件发现	第13-28页
·新闻网页抓取	第13-15页
·网络爬虫(Net Crawl)	第14页
·网页去噪	第14-15页
·语料预处理	第15-19页
·藏文编码处理与分词	第16-17页
·去除停用词	第17页
·命名实体识别	第17-19页
·文档的向量化	第19-23页
·特征项选择	第19-20页
·特征项抽取	第20-21页
·特征项的权值计算	第21-22页
·相似度计算方法	第22-23页
·两层聚类算法介绍	第23-26页
·文档聚类综述	第23页
·文档聚类的应用	第23-24页
·文档聚类的划分	第24-25页
·事件发现的流程	第25-26页
·判定热点事件	第26-27页
·分析热点事件的特征	第26页
·将事件特征量化	第26-27页
·本章小结	第27-28页
第四章系统实现	第28-40页
·系统所用工具以及环境配置	第28-29页
·系统的实现	第29-40页
·MySQL数据库	第29-37页
·系统界面预览	第37-39页
·本章小节	第39-40页
第五章实验结果分析	第40-42页
·采集数据	第40页
·实验步骤	第40页
·实验结果与评测	第40-42页
第六章结束语	第42-43页
·全文总结	第42页
·进一步的研究工作	第42-43页
参考文献	第43-46页
攻读学位期间的成果及发表论文	第46-49页
致谢	第49页