蒙古文网络热点词提取算法研究

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第10-16页
1.1 研究背景	第10-11页
1.2 研究意义	第11-12页
1.3 研究现状	第12-13页
1.4 蒙古文网络热点词的定义及特点	第13-14页
1.4.1 蒙古文网络热点词的定义	第13-14页
1.4.2 蒙古文网络热点词的特点	第14页
1.5 蒙古文网络热点词提取算法研究的难点	第14-15页
1.6 本文的研究内容与组织结构安排	第15-16页
第二章蒙古文网络热点词提取系统模型概述	第16-26页
2.1 新闻语料库的采集	第17-19页
2.1.1 网络爬虫	第17-18页
2.1.2 新闻网页的文本抽取	第18-19页
2.2 蒙古文语料自动分词	第19-23页
2.3 去停用词	第23-24页
2.4 词频统计	第24页
2.5 热点词提取算法	第24页
2.6 获取网络热点词汇并展现给用户	第24-25页
2.7 评测标准	第25页
2.8 本章小结	第25-26页
第三章蒙古文网络热点词提取算法研究	第26-33页
3.1 词汇权重计算方法	第26-29页
3.1.1 基于内容词汇词频的权重计算方法	第26页
3.1.2 基于词频位置加权的词汇权重计算方法	第26-27页
3.1.3 TF*PDF词汇权重计算方法	第27-28页
3.1.4 基于位置权重的TF*PDF词语权重计算方法	第28-29页
3.2 利用熵、3σ准则相结合的方法剔除“异常词”	第29-30页
3.2.1 词汇的熵值计算方法	第29-30页
3.2.2 3σ准则	第30页
3.3 基于方差的热点词变化度统计方法	第30-31页
3.4 构造蒙古文网络热点词汇表	第31-32页
3.5 本章小结	第32-33页
第四章实验及结果分析	第33-46页
4.1 实验的语料库	第33-34页
4.2 实验步骤	第34-42页
4.3 实验结果分析	第42-45页
4.4 本章小结	第45-46页
第五章结论与展望	第46-48页
5.1 结论	第46-47页
5.2 展望	第47-48页
参考文献	第48-51页
致谢	第51页