首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Bootstrapping的产品属性抽取技术研究

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-17页
    1.1 研究背景与意义第10-11页
        1.1.1 选题背景第10页
        1.1.2 研究意义第10-11页
    1.2 国内外研究现状第11-13页
        1.2.1 情感信息抽取概述第11-12页
        1.2.2 研究现状第12-13页
    1.3 本文的主要内容及组织结构第13-17页
        1.3.1 本文的主要研究内容第13-15页
        1.3.2 本文的组织结构第15-17页
第二章 依存关系模板及属性词提取算法第17-35页
    2.1 语料预处理第17-18页
        2.1.1 词性标注第17页
        2.1.2 依存关系解析第17-18页
    2.2 初始依存关系模板的识别第18-22页
        2.2.1 依存关系分类第18-19页
        2.2.2 关联规则第19-20页
        2.2.3 依存关系模板提取算法第20-21页
        2.2.4 依存关系模板提取结果分析第21-22页
    2.3 情感词典构建方法第22-23页
    2.4 基于Bootstrapping思想的机器学习方法概述第23-30页
        2.4.1 元自扩展算法第23-25页
        2.4.2 EM算法第25-27页
        2.4.3 Co-training算法第27-30页
    2.5 产品属性词抽取算法第30-34页
        2.5.1 基于改进的元自扩展算法抽取框架概述第31页
        2.5.2 候选依存关系获取及评价标准第31-33页
        2.5.3 候选属性词获取及评价标准第33-34页
    2.6 本章小结第34-35页
第三章 属性词相似性及聚类算法第35-47页
    3.1 词的特征表示及相似性算法第35-40页
        3.1.1 相似性计算方法概述第35-37页
        3.1.2 基于WordNet的词语相似性计算方法第37页
        3.1.3 基于web的词语相似性计算方法第37-40页
    3.2 属性词聚类算法第40-46页
        3.2.1 聚类方法概述第40页
        3.2.2 层次聚类及类间距离计算方法第40-41页
        3.2.3 K-Link层次聚类算法第41-46页
    3.3 本章小结第46-47页
第四章 系统设计与实现第47-51页
    4.1 系统概述第47页
    4.2 数据采集第47-48页
    4.3 数据预处理第48页
    4.4 情感词典的构建第48页
    4.5 种子依存关系集第48-49页
    4.6 属性词的抽取与筛选第49页
    4.7 属性词的聚类与过滤第49-50页
    4.8 本章小结第50-51页
第五章 实验与分析第51-58页
    5.1 信息抽取的评价指标第51页
    5.2 语料集第51-52页
    5.3 实验设计与结果分析第52-57页
    5.4 本章小结第57-58页
第六章 总结与展望第58-62页
    6.1 工作总结第58-60页
    6.2 展望第60-62页
参考文献第62-66页
致谢第66-67页
作者攻读学位期间发表的学术论文第67页

论文共67页,点击 下载论文
上一篇:社会工作专业毕业生的就业选择研究--以河北省为例
下一篇:企业的内部信任问题研究--以L企业为例