首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

开源中文分词器的比较研究

摘要第1-5页
Abstract第5-6页
目录第6-9页
1 引言第9-17页
   ·研究背景与意义第9-12页
   ·国内外研究现状第12-16页
     ·中文分词的理论研究第12-14页
     ·中文分词的应用研究第14-16页
   ·研究内容与方法第16页
   ·本文的创新之处第16页
   ·结构安排第16-17页
2 中文分词器的原理与评测标准第17-31页
   ·中文分词器的原理和工作流程第17-20页
   ·中文分词器的词典组织结构第20-23页
     ·基于整词二分的分词词典机制第20-21页
     ·基于TRIE索引树的分词词典机制第21-22页
     ·基于逐字二分的分词词典机制第22页
     ·基于双字哈希的分词词典机制第22-23页
   ·常用中文分词算法第23-27页
   ·中文分词研究所面临的问题第27-29页
     ·歧义词处理第27-28页
     ·新词识别第28-29页
   ·中文分词器的评测标准第29-30页
   ·本章小结第30-31页
3 试验方案和试验准备第31-40页
   ·研究对象的筛选第31-35页
   ·试验方案与安排第35-40页
     ·文档收集与资料准备第35-38页
     ·试验安排第38页
     ·测试环境介绍第38-40页
4 评测试验第40-60页
   ·测试环境的搭建与分词效果测试第40-48页
     ·分词器的安装与测试环境搭建第40-44页
     ·分词效果测试第44-48页
   ·准确率测试第48-53页
     ·icwb2-data标准语料的评测方法第48-50页
     ·icwb2-data标准语料评测结果的解读第50-51页
     ·icwb2-data标准语料评测结果分析第51-53页
   ·单项测试第53-55页
     ·人名识别测试第53-55页
     ·地名识别测试第55页
   ·分词速度测试第55-57页
   ·资源消耗测试第57-58页
   ·本章小结第58-60页
5 总结与展望第60-62页
参考文献第62-65页
附录第65-68页
致谢第68-69页
个人简历、在校期间发表的学术论文及研究成果第69页

论文共69页,点击 下载论文
上一篇:智能卡操作系统测试脚本语言的设计与实现
下一篇:基于CP-nets的多议题对称依赖关系的研究