基于条件随机场的网络文本分词研究

摘要	第1-5页
Abstract	第5-8页
1 绪论	第8-21页
·课题研究背景与意义	第8-9页
·汉语分词技术研究现状	第9-12页
·汉语分词技术的主要难点	第12-16页
·汉语分词规范	第12-14页
·切分歧义问题	第14-15页
·未登录词辨识	第15-16页
·汉语分词的主要方法	第16-20页
·基于规则的分词方法	第16-18页
·基于统计的分词方法	第18-19页
·基于理解的分词方法	第19-20页
·论文组织结构	第20-21页
2 统计语言模型	第21-31页
·隐马尔可夫模型	第21-24页
·隐马尔可夫模型原理	第22-23页
·隐马尔可夫模型在序列标记中的应用	第23-24页
·独立性假设问题	第24页
·最大熵马尔可夫模型	第24-27页
·最大熵马尔可夫模型原理	第24-25页
·最大熵马尔可夫模型在序列标记中的应用	第25-26页
·最大熵马尔可夫模型的局限性	第26-27页
·条件随机场模型	第27-31页
·条件随机场模型原理	第27-28页
·条件随机场模型的势函数表示	第28-29页
·条件随机场模型在序列标记中的应用	第29-30页
·条件随机场模型的参数估计	第30-31页
3 基于CRFs的网络文本分词	第31-45页
·网络文本特点分析	第31-33页
·基于字与基于词结合的CRFs分词	第33-39页
·基于字的CRFs分词	第33-35页
·基于词的CRFs分词	第35-37页
·字词结合CRFs中文分词	第37-39页
·平均互信息与C-value结合的未登录词识别	第39-43页
·未登录词的构成模式	第39-40页
·平均互信息	第40-41页
·C-value模型	第41-42页
·未登录词识别过程	第42-43页
·网络文本分词的后处理	第43-45页
4 实验结果与分析	第45-53页
·字词结合CRFs分词实验	第45-48页
·实验数据与评测标准	第45页
·实验结果	第45-48页
·未登录词识别实验	第48-51页
·实验数据与评测标准	第48页
·实验结果	第48-51页
·后处理分词结果实验	第51-52页
·实验数据与评测标准	第51页
·实验结果	第51-52页
·综合结果分析	第52-53页
结论	第53-55页
参考文献	第55-58页
攻读硕士学位期间发表学术论文情况	第58-59页
致谢	第59-60页