首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

多策略关键词抽取及快速文本主题分类研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第11-15页
    1.1 研究背景第11-12页
    1.2 研究现状第12-14页
    1.3 本文工作和组织结构第14-15页
第2章 关键词抽取和文本分类概述第15-21页
    2.1 关键词抽取基础第15-16页
    2.2 关键词抽取的普遍方法第16-17页
        2.2.1 基于统计信息的抽取方法第16页
        2.2.2 基于机器学习的抽取方法第16-17页
        2.2.3 基于浅层次语义分析的抽取方法第17页
    2.3 文本分类第17-18页
    2.4 中文文本的特征描述第18-20页
    2.5 本章小结第20-21页
第3章 利用语义分析挖掘隐含领域主题的关键词抽取第21-41页
    3.1 关键词的统计特征描述第21-23页
    3.2 利用语义相似度挖掘文章隐含主题第23-25页
        3.2.1 语义相似度测量方式的选择第23-24页
        3.2.2 HOWNET语义计算第24页
        3.2.3 固定分类的选择第24-25页
    3.3 有限主题分类第25-27页
    3.4 统计特征计算实验设计第27-29页
        3.4.1 任务描述第27页
        3.4.2 文本预处理第27-28页
        3.4.3 三组对比实验设计第28-29页
    3.5 语义计算实验设计第29-31页
        3.5.1 挖掘隐含主题第29-30页
        3.5.2 主题相似度加权第30-31页
    3.6 实验第31-39页
        3.6.1 实验语料与资源第31页
        3.6.2 评价方法第31-32页
        3.6.3 实验结果与结果分析第32-39页
    3.7 本章小结第39-41页
第4章 组合名词与词共现的关键词抽取第41-55页
    4.1 任务的提出第41页
    4.2 词组特征设计第41-43页
        4.2.1 名词合并的词组特征第41-42页
        4.2.2 合并方式第42-43页
    4.3 基于训练语料的词共现统计第43-44页
        4.3.1 词共现信息第43-44页
        4.3.2 训练语料第44页
    4.4 组合名词与词共现实验设计第44-46页
    4.5 实验第46-54页
        4.5.1 实验语料与资源第46-47页
        4.5.2 评价方法第47页
        4.5.3 实验结果与结果分析第47-54页
    4.6 本章小结第54-55页
第5章 基于二次分类和CHI统计量计算的快速文本分类第55-69页
    5.1 任务介绍第55页
    5.2 基于CHI统计量的特征权重设计第55-61页
        5.2.1 积极的分类算法设计第55-57页
        5.2.2 特征选择方法第57-59页
        5.2.3 方法对比与选择第59-60页
        5.2.4 特征权重设计第60-61页
    5.3 快速分类实验设计第61-62页
        5.3.1 训练文本的CHI计算第61-62页
        5.3.2 快速分类算法描述第62页
    5.4 二次分类设计思想第62-63页
    5.5 实验第63-68页
        5.5.1 实验语料与资源第63页
        5.5.2 评价方法第63-65页
        5.5.3 实验结果与分析第65-68页
    5.6 本章小结第68-69页
第6章 总结与展望第69-71页
    6.1 本文总结第69页
    6.2 未来工作第69-71页
参考文献第71-75页
致谢第75-77页
攻读硕士学位期间参加的科研项目第77页

论文共77页,点击 下载论文
上一篇:我国上市公司媒体监督对在职消费的影响研究--基于内部控制的实证分析
下一篇:聚苯胺纳米纤维材料的制备及应用基础研究