首页--文化、科学、教育、体育论文--信息与知识传播论文--图书馆学、图书馆事业论文--图书馆学论文--图书馆自动化、网络化论文--网络资源开发与利用论文

互联网舆情信息管控关键技术研究与实现

摘要第4-5页
ABSTRACT第5-6页
第1章 绪论第10-15页
    1.1 研究目的和意义第10-12页
    1.2 相关技术的研究现状第12页
    1.3 中文文本聚类模型的提出及本文内容安排第12-15页
第2章 中文文本表示技术第15-30页
    2.1 中文文本信息的预处理第15页
    2.2 汉语的几种自动分词技术第15-18页
    2.3 文本的向量化表示第18-20页
    2.4 文本特征的提取第20-21页
    2.5 经典的特征降维算法第21-22页
    2.6 权重计算第22-23页
    2.7 基于正向最大匹配的新词发现第23-30页
        2.7.1 背景简介第23-24页
        2.7.2 几种新词识别算法第24-27页
        2.7.3 本节研究重点第27页
        2.7.4 实验伪代码第27-28页
        2.7.5 实验结果第28-29页
        2.7.6 实验分析第29页
        2.7.7 本章小结第29-30页
第3章 文本聚类概述第30-42页
    3.1 文本聚类研究概述第30-35页
        3.1.1 聚类的研究背景第30-31页
        3.1.2 聚类的研究现状和发展趋势第31-33页
        3.1.3 文本聚类研究进展第33-35页
    3.2 文本聚类的主要过程第35-37页
        3.2.1 文本特征的建立第35-36页
        3.2.2 特征提取第36-37页
    3.3 文本聚类经典算法第37-41页
        3.3.1 K-Means 法第37-38页
        3.3.2 CURE 法第38-39页
        3.3.3 DBSCAN 法第39页
        3.3.4 SOM 法第39-40页
        3.3.5 几种文本聚类算法的比较总结第40-41页
    3.4 文本聚类的性能指标第41-42页
第4章 DK 聚类算法的设计与实现第42-56页
    4.1 CFK-MEANS 算法的关键问题及算法实现第42-45页
        4.1.1 聚类问题的数学描述第42-43页
        4.1.2 聚类特性的概念及其性质第43-44页
        4.1.3 CFK-Means 算法第44-45页
        4.1.4 CFK-Means 算法性能分析第45页
    4.2 基于密度聚类算法改进K-MEANS 算法第45-49页
        4.2.1 已有的初始聚类中心选取方法第46-47页
        4.2.2 选择初始中心的思路第47-48页
        4.2.3 新的初始聚类中心选取算法第48-49页
    4.3 DK 算法的实现第49-50页
        4.3.1 DK 算法步骤第49-50页
        4.3.2 DK 聚类算法时间复杂度分析第50页
        4.3.3 DK 聚类算法性能分析第50页
    4.4 实验描述与测试结果第50-56页
第5章 类描述信息的生成第56-61页
    5.1 研究背景第56页
    5.2 自动生成类描述信息的研究进展第56-58页
    5.3 引入聚类思想生成类描述信息第58-60页
    5.4 本章小结第60-61页
第6章 结束语第61-63页
参考文献第63-66页
致谢第66-67页
攻读学位期间发表的学术论文目录第67页

论文共67页,点击 下载论文
上一篇:铝合金热锻模具结构中的应力应变演变过程分析
下一篇:免疫胶体金技术快速检测大肠杆菌O157和志贺毒素