基于Web的新词语发现研究

摘要	第1-4页
Abstract	第4-5页
目录	第5-7页
图表目录	第7-8页
第一章绪论	第8-15页
·研究背景	第8-9页
·新词语的定义及分类	第9-11页
·新词语发现的难点	第11页
·新词语自动发现的意义	第11-12页
·本文中一些名词术语的定义	第12-13页
·本文的组织结构	第13-15页
第二章相关理论介绍	第15-23页
·计算语言学	第15-16页
·语料库语言学	第16-17页
·中文的自动分词	第17-20页
·词与自动分词的概念	第17-18页
·自动分词的方法	第18-20页
·词性标注	第20-21页
·小结	第21-23页
第三章新词语的自动发现	第23-49页
·目前新词语自动发现方法的不足及对策	第23-25页
·新词语自动发现基本思想和预期目标	第25-26页
·系统框图	第26-27页
·重复串查找算法研究	第27-40页
·现有的几种常用算法	第27-32页
·改进的重复串查找算法	第32-36页
·算法的时空复杂度	第36-38页
·算法实验	第38-40页
·提取网页的内容和日期	第40-44页
·新词语提取	第44-48页
·基本原理	第44页
·数据库的结构	第44-47页
·背景数据库和过滤数据库的形成	第47页
·评价函数的介绍	第47-48页
·新词语自动过滤	第48页
·小结	第48-49页
第四章结束语	第49-50页
参考文献	第50-54页
致谢	第54-55页
攻读硕士学位期间发表的论文	第55页