中文微博观点句识别及要素抽取研究

摘要	第4-5页
Abstract	第5-6页
1 绪论	第9-17页
1.1 目的与意义	第9页
1.2 任务描述	第9-10页
1.3 研究现状	第10-14页
1.3.1 观点句识别	第10-12页
1.3.2 观点句要素抽取	第12-14页
1.4 主要难点	第14-15页
1.4.1 中文微博分析难点	第14页
1.4.2 观点句识别的难点	第14-15页
1.4.3 观点句要素抽取的难点	第15页
1.5 本文工作	第15-17页
2 相关模型	第17-27页
2.1 支持向量机	第17-21页
2.1.1 线性可分支持向量机	第18-19页
2.1.2 线性可分支持向量机	第19-20页
2.1.3 非线性支持向量机	第20-21页
2.2 浅层狄利克雷分布	第21-23页
2.3 关联规则挖掘	第23-27页
2.3.1 基本概念	第23-24页
2.3.2 Apriori算法	第24-27页
3 中文微博观点句识别研究	第27-38页
3.1 特征选择	第27-29页
3.2 特征表示	第29-33页
3.2.1 离散表示法	第29-30页
3.2.2 分布表示法	第30-33页
3.3 观点句分类实验	第33-38页
3.3.1 数据集及评价标准	第33页
3.3.2 特征的离散表示法对比	第33-34页
3.3.3 组合方式的句子建模方法对比	第34-35页
3.3.4 分布方式的句子建模方法对比	第35页
3.3.5 单子句及多子句微博分类对比	第35-36页
3.3.6 实验结果分析	第36-38页
4 中文微博观点句要素抽取	第38-54页
4.1 预处理	第38页
4.2 主题分类及主题词选取	第38-40页
4.2.1 主题分类	第38-39页
4.2.2 主题词选取	第39-40页
4.3 对象和属性抽取	第40-44页
4.3.1 名词性频繁项集获取	第40-41页
4.3.2 频繁项集剪枝	第41-43页
4.3.3 频繁项集筛选	第43页
4.3.4 要素定界	第43-44页
4.4 对象和属性的对应	第44页
4.5 要素的倾向性判定	第44-45页
4.6 观点句要素抽取实验	第45-54页
4.6.1 数据集和评价标准	第45-46页
4.6.2 主题分类的实验	第46-47页
4.6.3 参数设置	第47-49页
4.6.4 不同实验方法对比	第49-50页
4.6.5 可信度剪枝的效果	第50页
4.6.6 对象及属性对应关系对比	第50-51页
4.6.7 与评测最好结果对比	第51-52页
4.6.8 实验结果分析	第52-54页
结论	第54-56页
参考文献	第56-60页
攻读硕士学位期间发表学术论文情况	第60-61页
致谢	第61-62页