中文新词语自动检测研究

声明	第1页
关于论文使用授权的说明	第3-4页
摘要	第4-5页
ABSTRACT	第5-8页
第一章引言	第8-14页
·什么是新词语	第8-9页
·新词语的分类	第9页
·新词语自动检测面临的困难	第9-10页
·新词语自动检测技术的现状概述	第10-11页
·新词语自动检测的意义	第11-12页
·本文研究的内容	第12页
·本文中一些名词术语的定义	第12-13页
·本文的组织	第13-14页
第二章新词语自动检测技术研究现状	第14-21页
·规则为主的新词语识别	第14-15页
·当用资源库的建立	第14页
·专业词汇获取设计	第14-15页
·该方法的实验效果	第15页
·统计为主的新词语识别	第15-21页
·串频统计的新词语识别	第15-18页
·其他统计的新词语识别方法	第18-21页
第三章基于INTERNET的新词语自动检测	第21-26页
·目前新词语自动检测方法的不足	第21页
·新词语的特征	第21-22页
·新词语的识别问题及对策	第22-23页
·基于INTERNET的新词语检测的目标和基本思想	第23-24页
·系统框图	第24-25页
·基于INTERNET的新词语检测的问题研究	第25-26页
第四章重复串查找	第26-36页
·重复串查找问题概述	第26页
·现有的重复串查找算法	第26-30页
·后缀树算法	第26-28页
·Sequitur算法	第28-29页
·其他算法	第29-30页
·重复串查找算法	第30-33页
·算法原理	第30-32页
·算法描述	第32-33页
·算法的时间空间复杂度	第33-35页
·结论	第35-36页
第五章提取网页的内容和日期	第36-41页
第六章新词语查找	第41-46页
·基本原理	第41页
·数据库的结构	第41-43页
·背景数据库和过滤数据库的形成	第43-44页
·新词语查找	第44页
·优缺点讨论	第44-46页
第七章新词语自动过滤和新词语词性猜测	第46-49页
·新词语自动过滤	第46-47页
·新词语词性猜测	第47-49页
第八章实验效果以及分析	第49-54页
·对于重复串查找算法的实验	第49-50页
·提取网页的内容和日期的实验	第50页
·基于INTERNET新词语自动检测效果的实验	第50-54页
第九章结束语	第54-55页
·本文总结	第54页
·今后的工作和改进	第54-55页
参考文献	第55-57页
致谢	第57-58页
作者简历	第58页