首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于汉语句法分析的微博聚类方法研究

摘要第3-4页
ABSTRACT第4页
第一章 绪论第7-15页
    1.1 课题背景及研究目的第7-10页
        1.1.1 课题背景第7-8页
        1.1.2 研究目的及意义第8-10页
    1.2 短文本聚类相关技术的发展第10-13页
        1.2.1 短文本处理的相关技术第10-12页
        1.2.2 短文本聚类的相关技术第12-13页
    1.3 研究内容及论文结构安排第13-15页
第二章 相关工具及理论研究第15-25页
    2.1 NLPIR 汉语分词系统第15-18页
        2.1.1 分词系统简介第15-17页
        2.1.2 汉语词性标记集第17-18页
    2.2 汉语句法分析第18-22页
        2.2.1 基于规则的句法分析方法第18-21页
        2.2.2 浅层句法分析第21-22页
    2.3 聚类分析第22-24页
        2.3.1 聚类的概念第22-23页
        2.3.2 常见的聚类算法第23-24页
    2.4 本章小结第24-25页
第三章 基于句法分析的关键词权值判定方法第25-43页
    3.1 构造句法分析器的需求分析第25-29页
        3.1.1 真实微博文本的特点第25-26页
        3.1.2 向量空间模型和 TF-IDF 公式第26-28页
        3.1.3 结合汉语语法特点构建特征向量第28-29页
    3.2 复杂短语的结构与分类第29-36页
        3.2.1 复杂短语结构分析第29-31页
        3.2.2 短语的分类第31-36页
    3.3 句法分析器的设计第36-42页
        3.3.1 句法分析流程第36-40页
        3.3.2 句法分析的辅助处理规则第40-42页
    3.4 本章小结第42-43页
第四章 微博聚类的实现第43-53页
    4.1 文本预处理第43-45页
        4.1.1 清除不规则格式第43-44页
        4.1.2 文本分词第44-45页
    4.2 微博的相似度计算第45-47页
        4.2.1 常规的相似度计算方法第45-46页
        4.2.2 改进的余弦相似度计算方法第46-47页
    4.3 微博聚类第47-51页
        4.3.1 层次聚类遇到的问题第47-48页
        4.3.2 微博的层次聚类第48-51页
    4.4 本章小结第51-53页
第五章 聚类效果的实验与分析第53-61页
    5.1 聚类的有效性评价第53-56页
        5.1.1 内部质量指标第54-55页
        5.1.2 外部质量指标第55-56页
    5.2 实验结果与分析第56-59页
        5.2.1 实验方案第56-57页
        5.2.2 评价方法第57页
        5.2.3 实验结果及分析第57-59页
    5.3 本章小结第59-61页
第六章 总结与展望第61-63页
    6.1 本文工作第61页
    6.2 未来研究展望第61-63页
致谢第63-65页
参考文献第65-68页

论文共68页,点击 下载论文
上一篇:气候变化和土地利用对蒙古高原植被覆盖影响
下一篇:基于机器学习的图像协同分类系统的设计与实现