首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

时间相关文本序列挖掘的关键技术研究

摘要第3-4页
Abstract第4-5页
第1章 引言第9-19页
    1.1 研究背景第9-11页
    1.2 相关研究现状第11-16页
        1.2.1 基于新闻报道序列的新闻话题发展过程分析第11-13页
        1.2.2 基于微博数据的突发新闻事件与用户评论挖掘第13-15页
        1.2.3 基于科学文献序列的文档重要性量化分析第15-16页
    1.3 本文的研究内容第16-19页
第2章 新闻话题突破点检测第19-40页
    2.1 概述第19-20页
    2.2 问题形式化第20-22页
    2.3 新闻话题空白片段检测第22-25页
    2.4 新闻话题突破点检测第25-27页
        2.4.1 新闻报道主题挖掘第25页
        2.4.2 主题强度波动建模第25-27页
    2.5 新闻话题时间线摘要生成第27-28页
    2.6 实验第28-39页
        2.6.1 数据集构建第28-30页
        2.6.2 新闻话题空白片段检测结果第30-33页
        2.6.3 新闻话题突破点检测结果第33-36页
        2.6.4 时间线摘要生成结果第36-39页
    2.7 本章小结第39-40页
第3章 时序文档连贯度建模第40-66页
    3.1 概述第40-43页
    3.2 问题形式化第43-46页
    3.3 算法框架第46-52页
        3.3.1 新闻话题连贯度图构建第46-49页
        3.3.2 新闻话题富信息事件挖掘第49-51页
        3.3.3 新闻故事线交互抽取第51-52页
    3.4 实验第52-64页
        3.4.1 数据集构建第52-54页
        3.4.2 标准答案构建第54-55页
        3.4.3 实验设置第55-57页
        3.4.4 评价指标第57-59页
        3.4.5 算法调参结果分析第59-62页
        3.4.6 不同方法结果比较第62-63页
        3.4.7 用户兴趣整合实验结果第63-64页
    3.5 本章小结第64-66页
第4章 新闻事件相关的文本相似度研究第66-81页
    4.1 概述第66-68页
    4.2 问题形式化第68-70页
    4.3 算法框架第70-74页
        4.3.1 数据预处理第70-71页
        4.3.2 同义词替换第71-72页
        4.3.3 时序 TF-IDF 算法第72-74页
    4.4 实验第74-80页
        4.4.1 数据集构建第74-77页
        4.4.2 实验结果与分析第77-80页
    4.5 本章小结第80-81页
第5章 时序文档重要性量化第81-102页
    5.1 概述第81-83页
    5.2 问题形式化与技术挑战第83-85页
    5.3 算法框架第85-91页
        5.3.1 候选技术主题挖掘第85-86页
        5.3.2 技术主题活跃度趋势建模第86-88页
        5.3.3 专利创新性和影响力量化第88-91页
    5.4 实验第91-100页
        5.4.1 数据集构建第91页
        5.4.2 实验参数设置第91-94页
        5.4.3 实验评价指标第94-95页
        5.4.4 实验结果分析第95-100页
    5.5 核心专利挖掘应用:石油工业公司竞争关系分析第100-101页
    5.6 本章小结第101-102页
第6章 总结与展望第102-104页
参考文献第104-112页
致谢第112-114页
个人简历、在学期间发表的学术论文与研究成果第114-115页

论文共115页,点击 下载论文
上一篇:混沌及超混沌系统的分析、控制、同步与电路实现
下一篇:环境舱VOCs标准散发样品研制及应用