首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于条件共现度的文本表示与特征抽取方法研究

摘要第4-6页
ABSTRACT第6-8页
主要符号表第17-18页
1 绪论第18-36页
    1.1 研究背景与意义第18-22页
        1.1.1 研究背景第18-21页
        1.1.2 研究意义第21-22页
    1.2 国内外研究进展第22-32页
        1.2.1 文本表示方法研究现状第22-26页
        1.2.2 文本特征词选择方法研究现状第26-28页
        1.2.3 主题发现方法研究现状第28-29页
        1.2.4 政策文本数据挖掘研究现状第29-30页
        1.2.5 已有研究工作中的不足第30-32页
    1.3 研究内容和结构第32-35页
        1.3.1 研究内容第32-34页
        1.3.2 论文结构第34-35页
    1.4 本章小结第35-36页
2 基于条件共现度矩阵的文本表示方法第36-55页
    2.1 问题提出第36-37页
    2.2 条件共现度矩阵文本表示方法第37-44页
        2.2.1 共现矩阵与共现度第37-39页
        2.2.2 条件共现度矩阵第39-40页
        2.2.3 模型优势分析第40-44页
    2.3 数值实验第44-54页
        2.3.1 实验设置和结果评估标准第44-46页
        2.3.2 实验结果与分析第46-52页
        2.3.3 灵敏度分析第52-54页
    2.4 本章小结第54-55页
3 基于条件共现度词网络的特征词排序方法第55-71页
    3.1 问题提出第55-56页
    3.2 相关工作第56-59页
        3.2.1 Jensen-Shannon散度第57页
        3.2.2 流形排序第57-59页
    3.3 算法构建第59-61页
        3.3.1 特征词初始重要性排序第59-60页
        3.3.2 条件共现度词网络构建第60页
        3.3.3 基于流形排序的特征词二次排序第60-61页
        3.3.4 算法总结第61页
    3.4 数值实验第61-69页
        3.4.1 实验数据第62页
        3.4.2 评价标准和对比方法第62-63页
        3.4.3 实验结果与分析第63-69页
    3.5 本章小结第69-71页
4 基于条件共现度的文本主题发现方法第71-89页
    4.1 问题提出第71-72页
    4.2 算法构建第72-79页
        4.2.1 文档语义结构拆分第72-73页
        4.2.2 子文档特征词扩充及重构第73-75页
        4.2.3 主题建模第75-78页
        4.2.4 子文档合并第78页
        4.2.5 算法总结第78-79页
    4.3 数值实验第79-88页
        4.3.1 实验设置与结果评估方法第79-81页
        4.3.2 文本分类实验与结果分析第81-85页
        4.3.3 主题发现实验与结果分析第85-88页
    4.4 本章小结第88-89页
5 政策文本内容特征抽取及社会变迁研究第89-120页
    5.1 问题提出第89-92页
    5.2 整体研究框架第92-93页
    5.3 研究方法第93-100页
        5.3.1 文本预处理方法第93-94页
        5.3.2 频繁词、关键词、热词以及新词的抽取方法第94-97页
        5.3.3 特征词时间序列聚类方法第97-98页
        5.3.4 时序文档的聚类方法第98-99页
        5.3.5 主题演化方法第99-100页
    5.4 研究结果及分析第100-118页
        5.4.1 频繁词、关键词、热词以及新词的发现结果及分析第100-108页
        5.4.2 社会活力曲线第108-109页
        5.4.3 时序政策文本阶段划分结果及分析第109-111页
        5.4.4 政策特征词时间序列聚类结果及分析第111-114页
        5.4.5 政策文本主题演化结果与分析第114-118页
    5.5 本章小结第118-120页
6 结论与展望第120-124页
    6.1 结论第120-121页
    6.2 创新点第121-122页
    6.3 展望第122-124页
参考文献第124-136页
攻读博士学位期间科研项目及科研成果第136-138页
致谢第138-140页
作者简介第140页

论文共140页,点击 下载论文
上一篇:人脸识别技术在唐氏综合征青少年筛查中的应用
下一篇:众包测试报告的挖掘与评估