首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

互联网广告投递中的商品名称识别

报送博士学位简况表第2-7页
摘要第7-9页
Abstract第9-10页
1 绪论第14-25页
    1.1 引言第14-15页
    1.2 互联网广告第15-18页
        1.2.1 参与者第15-17页
        1.2.2 定向投放第17-18页
    1.3 研究内容第18-22页
        1.3.1 商品别名识别第19-20页
        1.3.2 违禁品别名识别第20-21页
        1.3.3 商品名称位置识别第21-22页
    1.4 创新之处第22-23页
    1.5 本文的组织结构第23-25页
2 类实例自动获取研究现状第25-39页
    2.1 类实例自动获取简介第25-27页
    2.2 无结构文本第27-35页
        2.2.1 候选实例抽取第27-28页
        2.2.2 可靠性计算第28-35页
    2.3 半结构文本第35-38页
        2.3.1 候选实例抽取第35-36页
        2.3.2 可靠性计算第36-38页
    2.4 本章小结第38-39页
3 小训练样本命名实体识别研究现状第39-47页
    3.1 命名实体识别简介第39-42页
    3.2 减少所需训练数据的方法第42-46页
        3.2.1 半监督学习第42-44页
        3.2.2 主动学习第44-46页
    3.3 本章小结第46-47页
4 商品别名识别第47-67页
    4.1 引言第47-48页
    4.2 商品出售网页特点第48-49页
    4.3 CPAF系统框架第49-50页
    4.4 候选词抓取第50-52页
    4.5 无关词过滤第52-56页
        4.5.1 集合运算过滤第53-55页
        4.5.2 PMI修饰词过滤第55-56页
    4.6 候选词排序第56-61页
        4.6.1 图模型构建第57-59页
        4.6.2 RWR排序第59页
        4.6.3 Simrank++排序第59-61页
    4.7 Bootstrapping第61-62页
    4.8 实验与分析第62-66页
        4.8.1 数据与评估方法第62-63页
        4.8.2 性能分析第63-64页
        4.8.3 对比分析第64-66页
    4.9 本章小结第66-67页
5 违禁品别名识别第67-80页
    5.1 引言第67-68页
    5.2 CPIF系统第68-75页
        5.2.1 谷歌距离第69-72页
        5.2.2 数据抓取第72-73页
        5.2.3 候选词排序第73-74页
        5.2.4 Bootstrapping第74-75页
    5.3 实验与分析第75-79页
        5.3.1 实验设置第75页
        5.3.2 系统性能第75-76页
        5.3.3 与其他方法比较第76-79页
    5.4 本章小结第79-80页
6 商品名称位置识别第80-91页
    6.1 引言第80-81页
    6.2 特征集第81-85页
        6.2.1 局部特征第81-83页
        6.2.2 聚类特征第83-84页
        6.2.3 分布特征第84-85页
    6.3 条件随机场第85-87页
    6.4 实验与分析第87-89页
        6.4.1 数据与评估方法第87-88页
        6.4.2 特征比较第88-89页
    6.5 本章小结第89-91页
7 总结与展望第91-94页
    7.1 本文方法总结第91-92页
    7.2 未来工作展望第92-94页
参考文献第94-110页
攻读博士期间发表的学术论文及科研项目第110-111页
致谢第111页

论文共111页,点击 下载论文
上一篇:基于欧债危机视角下的最优货币区理论与实践反思
下一篇:当代中国特邀制度研究