首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Web文本的词语相似度计算研究及交通术语自动生成

摘要第4-5页
abstract第5-6页
第一章 绪论第9-15页
    1.1 研究背景第9-10页
    1.2 国内外研究现状第10-13页
        1.2.1 词语的相似度计算研究第10-11页
        1.2.2 主题挖掘研究发展第11-13页
        1.2.3 交通术语建立现状第13页
    1.3 课题研究内容及意义第13-14页
    1.4 论文组织结构第14-15页
第二章 基础方法和工具研究第15-31页
    2.1 网络爬虫第15-19页
        2.1.1 网络爬虫工作原理第15-17页
        2.1.2 Heritrix架构第17-19页
    2.2 ICTCLAS中文分词系统第19-20页
    2.3 LUCENE架构第20-23页
        2.3.1 LUCENE索引第20页
        2.3.2 倒排索引原理第20-23页
    2.4 层次分析法第23-26页
        2.4.1 层次分析法步骤第24-25页
        2.4.2 层次分析法优点第25-26页
    2.5 LDA主题模型第26-30页
        2.5.1 LDA主题模型介绍第26页
        2.5.2 文章、主题生成与分析第26-27页
        2.5.3 LDA主题生成方法第27-30页
    2.6 本章总结第30-31页
第三章 基于web文本的交通词语相似度计算方法第31-46页
    3.1 基于web文本的词语相似度计算算法研究第31-38页
        3.1.1 基于web文本的词语相似度计算算法研究第31-33页
        3.1.2 词语相似度计算模型第33-35页
        3.1.3 层次分析法权值计算第35-38页
    3.2 交通术语数据采集第38-42页
        3.2.1 创建一个新的抓取任务第38-39页
        3.2.2 扩展和自定义Heritrix第39-42页
    3.3 数据第42-43页
    3.4 词语索引的构建第43页
    3.5 实验数据及分析第43-45页
        3.5.1 实验结果第43-44页
        3.5.2 结果分析第44-45页
    3.6 本章小结第45-46页
第四章 基于网页数据文本的主题挖掘第46-56页
    4.1 网页数据文本清洗第46页
    4.2 术语挖掘流程第46-47页
    4.3 LDA主题挖掘第47-56页
        4.3.1 参数设置第47页
        4.3.2 文档生成的联合分布第47-48页
        4.3.3 Gibbs采样第48页
        4.3.4 LDA核心逻辑代码第48-50页
        4.3.5 LDA主题分布及选取第50-56页
第五章 交通术语构建第56-72页
    5.1 总体思路第56-61页
        5.1.1 LDA模型在交通术语中的应用第58-60页
        5.1.2 LDA模型主题词提炼第60-61页
    5.2 基于LDA的交通术语实验第61-72页
        5.2.1 交通术语主题发现第61-64页
        5.2.2 交通术语筛选方法第64-66页
        5.2.3 交通术语实验比对即分析第66-69页
        5.2.4 实践应用第69-72页
总结与展望第72-74页
参考文献第74-77页
攻读学位期间发表的论文与参与研究的项目第77-78页
致谢第78页

论文共78页,点击 下载论文
上一篇:OP模鼠MSCs生物学特性及药物对大鼠MSCs骨向分化的干预研究
下一篇:携带bFGF2基因的腺病毒转染内皮祖细胞用于缺血心肌移植的实验研究