首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于标题与正文的文本分类和评价对象抽取方法研究

摘要第3-5页
Abstract第5-6页
第一章 绪论第10-17页
    1.1 选题背景和意义第10-13页
    1.2 国内外研究现状第13-15页
        1.2.1 国外文本分类的研究现状第13-14页
        1.2.2 国内文本分类研究现状第14-15页
    1.3 本文的主要研究内容第15-16页
    1.4 本文章节安排第16-17页
第二章 文本分类的相关知识概述第17-28页
    2.1 文本分类的流程第17-18页
    2.2 文本分类的预处理第18-20页
        2.2.1 分词第18-19页
        2.2.2 去停用词第19-20页
        2.2.3 词性标注第20页
    2.3 文本分类的特征选择第20-23页
        2.3.1 词项频率第20-21页
        2.3.2 逆文档频率第21页
        2.3.3 互信息第21-22页
        2.3.4 信息增益第22页
        2.3.5 χ~2统计量第22-23页
    2.4 文本表示第23-24页
        2.4.1 向量空间模型第23-24页
        2.4.2 文本分布式表示第24页
    2.5 文本分类的分类算法第24-27页
        2.5.1 朴素贝叶斯文本分类第24-25页
        2.5.2 K-近邻第25页
        2.5.3 支持向量机第25-26页
        2.5.4 Rocchio分类算法第26-27页
    2.6 本章小结第27-28页
第三章 主题模型第28-42页
    3.1 主题模型简介第28页
    3.2 主题模型的工作原理第28-30页
    3.3 LSI模型第30页
    3.4 PLSI模型第30-34页
        3.4.1 PLSI模型简介第30-32页
        3.4.2 PSLI参数估计第32-34页
    3.5 LDA主题模型第34-39页
        3.5.1 LDA主题模型简介第34页
        3.5.2 LDA主题模型表示第34-36页
        3.5.3 LDA主题模型参数估计第36-39页
    3.6 BTM主题模型第39-41页
        3.6.1 BTM主题模型的表示第40-41页
        3.6.2 BTM主题模型的参数估计第41页
    3.7 本章小结第41-42页
第四章 基于标题和正文的主题建模第42-54页
    4.1 问题的提出第42页
    4.2 模型介绍第42-44页
    4.3 参数估计第44-46页
    4.4 实验与结果第46-53页
        4.4.1 实验数据集第46-47页
        4.4.2 实验环境第47-48页
        4.4.3 对比试验、评估方法和分类器第48-49页
        4.4.4 命名实体识别第49-50页
        4.4.5 分类实验结果第50-53页
    4.5 本章小结第53-54页
第五章 基于直通车标题评价对象的抽取第54-66页
    5.1 问题提出第54-55页
    5.2 抽取评价对象第55-60页
        5.2.1 抽取潜在的评价对象第55-58页
        5.2.2 基于动词词典库获取真实的评价对象第58-60页
    5.3 抽取评价对象实验第60-64页
        5.3.1 实验数据集和评估方法第60页
        5.3.2 实验设置第60-61页
        5.3.3 实验结果第61-64页
    5.4 本章小结第64-66页
第六章 总结和展望第66-67页
参考文献第67-73页
图表目录第73-75页
List of Figures and Tables第75-77页
致谢第77-78页
攻读硕士期间参加发表的论文第78页

论文共78页,点击 下载论文
上一篇:搜索引擎评估指标自动推荐方法的研究
下一篇:作者资讯中的有用文本信息抽取方法研究