首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向热点新闻话题的文本处理技术研究

摘要第5-7页
Abstract第7-8页
第1章 绪论第15-30页
    1.1 研究的问题与意义第15-20页
        1.1.1 相关概念第17-18页
        1.1.2 任务定义第18-20页
    1.2 国内外研究现状第20-27页
        1.2.1 共性技术及研究现状第20-25页
        1.2.2 目前存在的问题第25-27页
    1.3 本文的研究内容第27-28页
    1.4 论文的结构安排第28-30页
第2章 面向文本分类问题的划分和描述体系第30-41页
    2.1 当前的文本分类划分体系第31-33页
    2.2 对文本分类方法的三维划分体系第33-34页
    2.3 扩展的文本分类模型描述架构第34-37页
    2.4 文本分类问题的进一步讨论第37-40页
    2.5 本章小结第40-41页
第3章 基于向量空间模型的层次化文本分类技术第41-58页
    3.1 基于支持向量机和决策树的文本分类方法第41-45页
        3.1.1 基于支持向量机的文本分类方法第42-43页
        3.1.2 基于决策树的文本分类方法第43-45页
    3.2 SVM决策树的构建策略第45-47页
        3.2.1 决策树的构造方式第45-46页
        3.2.2 样本集规模的影响第46页
        3.2.3 决策树的结构形式第46-47页
        3.2.4 类间相似度的影响第47页
    3.3 多策略融合的SVM决策树构建算法第47-51页
    3.4 基于SVM决策树的文本分类方法第51-53页
    3.5 文本分类实验及分析第53-57页
    3.6 本章小结第57-58页
第4章 面向动态文本集的话题参数获取方法第58-73页
    4.1 LDA和ILDA模型介绍第62-65页
        4.1.1 LDA模型简介第62-63页
        4.1.2 ILDA模型简介第63-65页
    4.2 动态话题数下的话题演化分析第65-68页
        4.2.1 基于Gibbs采样的ILDA话题数获取算法第65-67页
        4.2.2 话题关联度计算、阈值确定和文本集处理方法第67-68页
    4.3 基于ILDA模型的话题数目和话题演化实验第68-72页
        4.3.1 NIPS语料上话题数的确定实验第68-69页
        4.3.2 关于“神九”报道的话题演化分析第69-72页
    4.4 本章小结第72-73页
第5章 融合动静特征的自适应话题模型第73-85页
    5.1 话题倾斜问题的现有处理方法第74-75页
    5.2 动静结合的自适应话题模型第75-78页
    5.3 基于重采样的模型参数获取算法第78-79页
    5.4 基于自适应话题模型的文本分类和话题演化实验第79-84页
        5.4.1 NIPS语料上的话题参数对比实验第80-81页
        5.4.2 汉语文本集上的话题演化分析实验第81-84页
    5.5 本章小结第84-85页
第6章 热点话题处理架构第85-97页
    6.1 热点话题处理架构第85-86页
    6.2 数据采集模块第86-88页
    6.3 热点知识库构建模块第88-90页
    6.4 热点话题识别模块第90-93页
    6.5 热点话题跟踪模块第93-94页
    6.6 热点话题演化模块第94-95页
    6.7 本章小结第95-97页
总结与展望第97-99页
参考文献第99-110页
攻读学位期间发表论文与研究成果清单第110-111页
致谢第111-112页
作者简介第112页

论文共112页,点击 下载论文
上一篇:基于POSS(T8)桥联的单分子有机太阳能电池研究
下一篇:BNT-BT基无铅压电陶瓷的制备与改性研究