基于藏文web舆情分析的热点发现算法研究
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 第一章 绪论 | 第9-14页 |
| ·课题背景及课题来源 | 第9页 |
| ·国内外研究现状 | 第9-12页 |
| ·话题发现与跟踪技术 | 第10-11页 |
| ·藏文信息处理现状 | 第11-12页 |
| ·舆情分析现状 | 第12页 |
| ·论文内容安排 | 第12-14页 |
| 第二章 系统总体设计 | 第14-16页 |
| ·系统设计思路 | 第14-15页 |
| ·系统框架结构图 | 第15-16页 |
| 第三章 藏文话题识别 | 第16-32页 |
| ·话题识别模型介绍 | 第16-18页 |
| ·布尔模型 | 第16页 |
| ·向量空间模型 | 第16-17页 |
| ·概率模型 | 第17-18页 |
| ·语言模型 | 第18页 |
| ·藏文新闻语料的采集 | 第18-21页 |
| ·语料的选取 | 第18-19页 |
| ·网络爬虫 | 第19-20页 |
| ·文本抽取 | 第20-21页 |
| ·语料的预处理 | 第21-28页 |
| ·编码转换 | 第21-24页 |
| ·藏文分词 | 第24-25页 |
| ·藏文命名实体识别 | 第25-28页 |
| ·话题识别算法 | 第28-32页 |
| ·特征选择及权值计算 | 第28-29页 |
| ·相似度计算 | 第29-30页 |
| ·增量聚类算法 | 第30-32页 |
| 第四章 热点话题发现 | 第32-35页 |
| ·热点话题概念及特征 | 第32-33页 |
| ·热点话题的特点 | 第32页 |
| ·热点话题特征量化 | 第32-33页 |
| ·热点话题计算 | 第33-35页 |
| 第五章 藏文热点话题呈现 | 第35-37页 |
| ·话题标题 | 第35页 |
| ·话题相关文档 | 第35-36页 |
| ·话题相关词群 | 第36页 |
| ·实验及结果分析 | 第36-37页 |
| 第六章 结束语 | 第37-38页 |
| ·总结 | 第37页 |
| ·进一步工作 | 第37-38页 |
| 参考文献 | 第38-40页 |
| 致谢 | 第40-41页 |
| 攻读学位期间的成果及发表论文 | 第41页 |