首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Ajax深度信息获取及聚类关键技术的研究

致谢第5-6页
摘要第6-7页
ABSTRACT第7页
1 引言第10-15页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-12页
    1.3 本文主要工作第12-13页
    1.4 论文组织结构第13-15页
2 相关知识介绍第15-28页
    2.1 支持Ajax技术的深度网络第15-18页
        2.1.1 深度网络简介第15-16页
        2.1.2 Ajax技术简介第16-18页
    2.2 网络爬虫技术第18-21页
        2.2.1 通用网络爬虫简介第18-19页
        2.2.2 Ajax深度爬虫简介第19-21页
    2.3 文本聚类相关技术第21-27页
        2.3.1 信息预处理第21-23页
        2.3.2 特征项权重计算第23-24页
        2.3.3 向量空间模型第24-25页
        2.3.4 文本聚类常用算法第25-27页
    2.4 本章小结第27-28页
3 基于事件驱动的信息采集技术研究与改进第28-41页
    3.1 公开课网络结构分析第28-30页
        3.1.1 网络结构特点第28-30页
        3.1.2 Ajax页面相关事件第30页
    3.2 传统评论采集方法及存在的局限第30-34页
        3.2.1 传统Ajax评论页URL抽取第31页
        3.2.2 传统Ajax评论信息采集方法第31-33页
        3.2.3 传统方法存在的局限第33-34页
    3.3 改进的Ajax评论采集技术第34-40页
        3.3.1 嵌入式浏览器的选择第34-35页
        3.3.2 优化的Ajax信息采集第35-39页
        3.3.3 数据库设计第39-40页
    3.4 本章小结第40-41页
4 短文本信息聚类技术的研究与优化第41-51页
    4.1 传统VSM模型第41-42页
    4.2 LDA主题模型的引入第42-43页
    4.3 基于LDA的传统K-means算法第43-46页
        4.3.1 算法基本思想描述第44-45页
        4.3.2 存在的局限第45-46页
    4.4 基于LDA+VSM模型优化的K-means算法第46-50页
        4.4.1 基于LDA优化初始中心的确定第46-47页
        4.4.2 基于LDA+VSM优化文本相似度公式第47-48页
        4.4.3 整体优化的K-means聚类过程描述第48-49页
        4.4.4 文本聚类话题识别第49-50页
    4.5 本章小结第50-51页
5 实验结果与分析第51-61页
    5.1 实验环境第51页
    5.2 信息采集实验结果及分析第51-52页
    5.3 聚类实验结果及分析第52-60页
        5.3.1 文本聚类评价标准第53页
        5.3.2 实验相关参数设定第53-55页
        5.3.3 文本聚类结果与分析第55-60页
    5.4 本章小结第60-61页
6 总结与展望第61-63页
    6.1 总结第61-62页
    6.2 研究展望第62-63页
参考文献第63-66页
作者简历及攻读硕士学位期间取得的研究成果第66-68页
学位论文数据集第68页

论文共68页,点击 下载论文
上一篇:西部欠发达地区中小企业成长方式研究
下一篇:三电平背靠背变换器的控制策略研究