首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于时间序列的网络新闻关键词相似性的研究及应用

摘要第5-6页
Abstract第6-7页
第一章 绪论第12-18页
    1.1 研究背景与意义第12-14页
    1.2 国内外研究现状第14-16页
        1.2.1 英文分词及词组提取技术的研究现状第14页
        1.2.2 时间序列挖掘技术的研究现状第14-16页
    1.3 本文主要工作及论文结构第16-17页
    1.4 本章小结第17-18页
第二章 相关技术介绍第18-28页
    2.1 英文分词技术第18-20页
        2.1.1 英文分词相关概念第18页
        2.1.2 词汇分割、过滤和转换第18页
        2.1.3 机械性分词第18-20页
            2.1.3.1 最大匹配法第19页
            2.1.3.2 最小匹配法第19页
            2.1.3.3 基于词频统计的分词方法第19-20页
        2.1.4 理解性分词第20页
    2.2 时间序列挖掘技术第20-27页
        2.2.1 时间序列相关概念第20-21页
        2.2.2 时间序列表示方法第21-24页
            2.2.2.1 离散傅立叶变换第21-22页
            2.2.2.2 离散小波变换第22页
            2.2.2.3 分段线性表示法第22-23页
            2.2.2.4 分段累积近似法第23-24页
        2.2.3 时间序列相似性度量方法第24-25页
            2.2.3.1 欧几里得距离第24页
            2.2.3.2 动态时间弯曲距离第24-25页
            2.2.3.3 编辑距离第25页
            2.2.3.4 最长公共子序列距离第25页
        2.2.4 时间序列相似性索引和查询方法第25-27页
            2.2.4.1 滑动窗口第26页
            2.2.4.2 Trie 树第26页
            2.2.4.3 k-d 树第26-27页
    2.3 本章小结第27-28页
第三章 时间序列相关性分析系统总体设计第28-48页
    3.1 总体设计第28-29页
    3.2 PhraseAnalyzer 英文词组提取器设计第29-32页
        3.2.1 总体架构第30页
        3.2.2 词典第30页
        3.2.3 基础分词器第30-31页
        3.2.4 词组提取第31页
        3.2.5 二义性词组提取第31页
        3.2.6 总体流程图第31-32页
    3.3 时间序列相似性分析模块设计第32-47页
        3.3.1 总体架构第32-33页
        3.3.2 时间序列表示方法的算法设计第33-42页
            3.3.2.1 极值点分段线性表示法第33-34页
            3.3.2.2 特征点分段线性表示法第34-35页
            3.3.2.3 斜率提取边缘点分段线性表示法第35-36页
            3.3.2.4 移动窗口分段线性表示法第36-37页
            3.3.2.5 从上到下分段线性表示法第37-38页
            3.3.2.6 从下到上分段线性表示法第38页
            3.3.2.7 关键点分段线性表示法第38-42页
        3.3.3 时间序列相似性度量方法的算法设计第42-45页
            3.3.3.1 欧几里得距离第42-43页
            3.3.3.2 斜率反正切值距离第43-45页
            3.3.3.3 基于斜率反正切值的规范化相似性度量方法第45页
        3.3.4 时间序列相似性查询方法的算法设计第45-47页
            3.3.4.1 滑动窗口第45-46页
            3.3.4.2 Trie 树第46-47页
            3.3.4.3 后缀树第47页
    3.4 本章小结第47-48页
第四章 时间序列相关性分析系统详细设计第48-61页
    4.1 时间序列相关性分析系统实现第48页
    4.2 PhraseAnalyzer 英文词组提取器实现第48-54页
        4.2.1 词汇类型第48-49页
        4.2.2 词典扩充第49页
        4.2.3 词组提取方法第49-52页
            4.2.3.1 词组提取实现第49-50页
            4.2.3.2 RMM 算法实现第50-51页
            4.2.3.3 二义性词组提取实现第51-52页
        4.2.4 多线程实现第52-53页
        4.2.5 详细流程图第53-54页
    4.3 时间序列相关算法实现第54-60页
        4.3.1 规范化的关键点分段线性表示方法的实现第54-57页
        4.3.2 基于斜率反正切值的相似性度量方法的实现第57页
        4.3.3 后缀树索引和查询方法的实现第57-60页
    4.6 本章小结第60-61页
第五章 实验与测试分析第61-78页
    5.1 测试目的第61页
    5.2 测试环境第61-62页
        5.2.1 硬件环境第61页
        5.2.2 软件环境第61-62页
    5.3 测试方法第62-63页
        5.3.1 英文词组提取测试方法第62页
        5.3.2 时间序列挖掘测试方法第62-63页
            5.3.2.1 关键点分段线性表示方法测试第62页
            5.3.2.2 时间序列相似性查询方法测试第62-63页
    5.4 结果分析第63-77页
        5.4.1 英文词组提取第63-67页
            5.4.1.1 功能测试第63-65页
            5.4.1.2 性能测试第65-67页
        5.4.2 时间序列相似性分析第67-77页
            5.4.2.1 关键点分段线性表示方法测试第67-72页
            5.4.2.2 时间序列相似性查询方法测试第72-77页
    5.5 本章小结第77-78页
结论第78-80页
参考文献第80-82页
攻读硕士学位期间取得的成果研究第82-83页
致谢第83-84页
附件第84页

论文共84页,点击 下载论文
上一篇:基于机器学习的情景词库构建与实现
下一篇:基于AutoCAD与ArcSDE的规划数据互操作及其应用研究