首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于中文短语串的细粒度主题信息抽取及文本聚类算法

摘要第5-6页
ABSTRACT第6页
第一章 绪论第9-16页
    1.1 研究背景与意义第9-11页
        1.1.1 热点话题挖掘与跟踪第9-10页
        1.1.2 舆情趋势分析第10页
        1.1.3 专家系统知识抽取第10-11页
    1.2 国内外的研究现状第11-14页
        1.2.1 短文本信息提取的研究现状第11-12页
        1.2.2 文本分类聚类的研究现状第12-14页
    1.3 本文的主要工作及创新点第14页
    1.4 论文的主要结构安排第14-16页
第二章 文本主题抽取以及文本聚类相关技术第16-27页
    2.1 文本预处理第16-17页
    2.2 文本特征表示第17-19页
    2.3 文本特征提取第19-21页
    2.4 文本相似度计算第21-22页
    2.5 聚类算法第22-25页
    2.6 文本聚类效果质量评估第25-26页
    2.7 本章小结第26-27页
第三章 基于双层语料过滤器的中文短语串抽取方法第27-43页
    3.1 中文短语串的语义表达优势第27-28页
    3.2 双层语料过滤器的主要思想第28-29页
    3.3 第一层语料过滤器—词性过滤器第29-34页
        3.3.1 基于词性的正则表达式匹配第29-31页
        3.3.2 DFA处理第31-34页
    3.4 第二层语料过滤器—短语扩展过滤器第34-39页
        3.4.1 词语串频信息统计第34-36页
        3.4.2 词语串频信息参数分析第36-37页
        3.4.3 候选种子词选取与短语扩展第37-39页
    3.5 实验与计算结果第39-42页
    3.6 本章小结第42-43页
第四章 基于融合词语串频信息的ROCK聚类方法第43-54页
    4.1 ROCK聚类方法第43-44页
    4.2 基于词语串频信息的ROCK聚类方法思想第44-46页
    4.3 构建短语关联文档模型以及文档相关联模型第46-47页
    4.4 文本相似度计算第47-48页
    4.5 指导合并的Goodness函数第48-49页
    4.6 算法伪代码表示第49页
    4.7 实验结果与分析第49-53页
    4.8 本章小结第53-54页
第五章 基于客户投诉服务的热点发现系统第54-62页
    5.1 基于客户投诉服务的热点发现系统HSMS简述第54-55页
    5.2 HSMS主要功能第55-56页
    5.3 HSMS功能流程分析与总体设计第56-60页
        5.3.1 HSMS功能流程分析第56-57页
        5.3.2 HSMS系统设计第57-60页
    5.4 HSMS运行效果第60-61页
    5.5 本章小结第61-62页
第六章 总结与展望第62-64页
    6.1 总结第62-63页
    6.2 下一步工作展望第63-64页
参考文献第64-68页
攻读硕士学位期间主要论文及出版物第68-69页
致谢第69-70页
附件第70页

论文共70页,点击 下载论文
上一篇:基于视频分析的行人检测及统计方法研究
下一篇:JPEG图像密文域可逆隐写研究