基于藏文web舆情分析的热点发现算法研究
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第一章 绪论 | 第9-14页 |
·课题背景及课题来源 | 第9页 |
·国内外研究现状 | 第9-12页 |
·话题发现与跟踪技术 | 第10-11页 |
·藏文信息处理现状 | 第11-12页 |
·舆情分析现状 | 第12页 |
·论文内容安排 | 第12-14页 |
第二章 系统总体设计 | 第14-16页 |
·系统设计思路 | 第14-15页 |
·系统框架结构图 | 第15-16页 |
第三章 藏文话题识别 | 第16-32页 |
·话题识别模型介绍 | 第16-18页 |
·布尔模型 | 第16页 |
·向量空间模型 | 第16-17页 |
·概率模型 | 第17-18页 |
·语言模型 | 第18页 |
·藏文新闻语料的采集 | 第18-21页 |
·语料的选取 | 第18-19页 |
·网络爬虫 | 第19-20页 |
·文本抽取 | 第20-21页 |
·语料的预处理 | 第21-28页 |
·编码转换 | 第21-24页 |
·藏文分词 | 第24-25页 |
·藏文命名实体识别 | 第25-28页 |
·话题识别算法 | 第28-32页 |
·特征选择及权值计算 | 第28-29页 |
·相似度计算 | 第29-30页 |
·增量聚类算法 | 第30-32页 |
第四章 热点话题发现 | 第32-35页 |
·热点话题概念及特征 | 第32-33页 |
·热点话题的特点 | 第32页 |
·热点话题特征量化 | 第32-33页 |
·热点话题计算 | 第33-35页 |
第五章 藏文热点话题呈现 | 第35-37页 |
·话题标题 | 第35页 |
·话题相关文档 | 第35-36页 |
·话题相关词群 | 第36页 |
·实验及结果分析 | 第36-37页 |
第六章 结束语 | 第37-38页 |
·总结 | 第37页 |
·进一步工作 | 第37-38页 |
参考文献 | 第38-40页 |
致谢 | 第40-41页 |
攻读学位期间的成果及发表论文 | 第41页 |