汉语主客观文本分类及预处理研究

摘要	第1-6页
Abstract	第6-12页
1 引言	第12-15页
·问题的提出	第12页
·目的和意义	第12-13页
·本文的贡献	第13-14页
·其他章节介绍	第14-15页
2 相关研究概述	第15-19页
·主客观文本分类	第15-16页
·非规范语言处理	第16页
·相关资源	第16-19页
3 主客观文本分类	第19-29页
·分类一般流程	第19页
·分类算法介绍	第19-24页
·朴素贝叶斯分类方法	第19-20页
·决策树分类算法	第20-21页
·基于最大熵模型	第21-22页
·支持向量机模型	第22-24页
·主客观文本特征选择	第24-27页
·非规范文本	第24页
·主观性文本	第24-25页
·客观性文本	第25页
·特征选取	第25-27页
·分类流程	第27-29页
4 非规范语言处理	第29-35页
·基础资源构造	第29-32页
·网络蜘蛛的构建及语料获取	第30-31页
·非规范词典的构建	第31-32页
·非规范语言的形式和类别	第32-33页
·处理方法介绍	第33-35页
5 正规化处理具体实现	第35-57页
·处理流程	第35-37页
·典型非规范语言处理	第37-43页
·处理的难点	第37-38页
·序列覆盖算法	第38-41页
·构造算法	第41-43页
·歧义非规范词语处理	第43-52页
·难点分析	第43页
·解决方法	第43-47页
·特征选取	第47-48页
·序列核概念	第48-52页
·歧义非规范语言处理方法	第52-57页
6 实验	第57-65页
·评测概述	第57-58页
·主客观分类实验	第58-62页
·实验语料	第58-59页
·实验结果及分析	第59-62页
·非规范语言处理实验	第62-65页
·实验语料	第62页
·实验结果及分析	第62-65页
7 总结和展望	第65-66页
参考文献	第66-70页
致谢	第70-71页
攻读学位期间发表的学术论文	第71-74页
上海交通大学学位论文答辩决议书	第74页