首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

增量式聚类的新闻热点话题发现研究

摘要第3-4页
ABSTRACT第4-5页
1 绪论第9-14页
    1.1 引言第9-10页
    1.2 国内外研究现状第10-12页
    1.3 论文的主要工作和创新点第12页
    1.4 论文的结构安排第12-14页
2 相关理论和技术研究第14-28页
    2.1 TDT相关知识第14-17页
        2.1.1 TDT基本概念第14-15页
        2.1.2 TDT主要任务第15-16页
        2.1.3 TDT评估指标第16-17页
    2.2 网络爬虫技术第17-18页
        2.2.1 爬虫分类第17-18页
        2.2.2 爬虫的策略第18页
        2.2.3 爬虫的工作方式第18页
    2.3 文本向量表示模型第18-19页
    2.4 聚类算法第19-22页
        2.4.1 层次聚类方法第20页
        2.4.2 划分聚类方法第20-21页
        2.4.3 密度聚类方法第21页
        2.4.4 网格聚类方法第21页
        2.4.5 增量式聚类方法第21-22页
    2.5 特征选择第22-25页
        2.5.1 基于文档频率特征提取法第23页
        2.5.2 χ2统计法第23-24页
        2.5.3 信息增益法第24页
        2.5.4 互信息法第24-25页
    2.6 文本向量距离公式介绍第25-27页
    2.7 本章小结第27-28页
3 热点话题发现研究第28-41页
    3.1 热点话题发现的整体框架第28-29页
    3.2 信息采集第29-30页
    3.3 中文分词技术第30-33页
    3.4 特征值选择与权重计算第33-34页
    3.5 文本向量化第34-35页
    3.6 相似度算法第35-36页
    3.7 Single-Pass增量式聚类算法第36-38页
    3.8 改进的Single-Pass增量式聚类算法第38-40页
    3.9 热度评估第40页
    3.10 本章小结第40-41页
4 实验测试分析第41-47页
    4.1 实验设计第41-45页
    4.2 实验结果分析第45-46页
        4.2.1 标题权重参数设置第45页
        4.2.2 实验结果对比分析第45-46页
    4.3 本章小结第46-47页
5 总结与展望第47-49页
    5.1 全文总结第47页
    5.2 工作不足与展望第47-49页
参考文献第49-53页
致谢第53-54页
攻读硕士学位期间发表的学术论文第54-55页
攻读硕士学位期间参与的科研项目第55页

论文共55页,点击 下载论文
上一篇:鸽群优化算法及其应用研究
下一篇:基于FPGA的实例型SAT求解芯片的设计与实现