互联网广告投递中的商品名称识别

报送博士学位简况表	第2-7页
摘要	第7-9页
Abstract	第9-10页
1 绪论	第14-25页
1.1 引言	第14-15页
1.2 互联网广告	第15-18页
1.2.1 参与者	第15-17页
1.2.2 定向投放	第17-18页
1.3 研究内容	第18-22页
1.3.1 商品别名识别	第19-20页
1.3.2 违禁品别名识别	第20-21页
1.3.3 商品名称位置识别	第21-22页
1.4 创新之处	第22-23页
1.5 本文的组织结构	第23-25页
2 类实例自动获取研究现状	第25-39页
2.1 类实例自动获取简介	第25-27页
2.2 无结构文本	第27-35页
2.2.1 候选实例抽取	第27-28页
2.2.2 可靠性计算	第28-35页
2.3 半结构文本	第35-38页
2.3.1 候选实例抽取	第35-36页
2.3.2 可靠性计算	第36-38页
2.4 本章小结	第38-39页
3 小训练样本命名实体识别研究现状	第39-47页
3.1 命名实体识别简介	第39-42页
3.2 减少所需训练数据的方法	第42-46页
3.2.1 半监督学习	第42-44页
3.2.2 主动学习	第44-46页
3.3 本章小结	第46-47页
4 商品别名识别	第47-67页
4.1 引言	第47-48页
4.2 商品出售网页特点	第48-49页
4.3 CPAF系统框架	第49-50页
4.4 候选词抓取	第50-52页
4.5 无关词过滤	第52-56页
4.5.1 集合运算过滤	第53-55页
4.5.2 PMI修饰词过滤	第55-56页
4.6 候选词排序	第56-61页
4.6.1 图模型构建	第57-59页
4.6.2 RWR排序	第59页
4.6.3 Simrank++排序	第59-61页
4.7 Bootstrapping	第61-62页
4.8 实验与分析	第62-66页
4.8.1 数据与评估方法	第62-63页
4.8.2 性能分析	第63-64页
4.8.3 对比分析	第64-66页
4.9 本章小结	第66-67页
5 违禁品别名识别	第67-80页
5.1 引言	第67-68页
5.2 CPIF系统	第68-75页
5.2.1 谷歌距离	第69-72页
5.2.2 数据抓取	第72-73页
5.2.3 候选词排序	第73-74页
5.2.4 Bootstrapping	第74-75页
5.3 实验与分析	第75-79页
5.3.1 实验设置	第75页
5.3.2 系统性能	第75-76页
5.3.3 与其他方法比较	第76-79页
5.4 本章小结	第79-80页
6 商品名称位置识别	第80-91页
6.1 引言	第80-81页
6.2 特征集	第81-85页
6.2.1 局部特征	第81-83页
6.2.2 聚类特征	第83-84页
6.2.3 分布特征	第84-85页
6.3 条件随机场	第85-87页
6.4 实验与分析	第87-89页
6.4.1 数据与评估方法	第87-88页
6.4.2 特征比较	第88-89页
6.5 本章小结	第89-91页
7 总结与展望	第91-94页
7.1 本文方法总结	第91-92页
7.2 未来工作展望	第92-94页
参考文献	第94-110页
攻读博士期间发表的学术论文及科研项目	第110-111页
致谢	第111页