声明 | 第1页 |
关于论文使用授权的说明 | 第3-4页 |
摘要 | 第4-5页 |
ABSTRACT | 第5-8页 |
第一章 引言 | 第8-14页 |
·什么是新词语 | 第8-9页 |
·新词语的分类 | 第9页 |
·新词语自动检测面临的困难 | 第9-10页 |
·新词语自动检测技术的现状概述 | 第10-11页 |
·新词语自动检测的意义 | 第11-12页 |
·本文研究的内容 | 第12页 |
·本文中一些名词术语的定义 | 第12-13页 |
·本文的组织 | 第13-14页 |
第二章 新词语自动检测技术研究现状 | 第14-21页 |
·规则为主的新词语识别 | 第14-15页 |
·当用资源库的建立 | 第14页 |
·专业词汇获取设计 | 第14-15页 |
·该方法的实验效果 | 第15页 |
·统计为主的新词语识别 | 第15-21页 |
·串频统计的新词语识别 | 第15-18页 |
·其他统计的新词语识别方法 | 第18-21页 |
第三章 基于INTERNET的新词语自动检测 | 第21-26页 |
·目前新词语自动检测方法的不足 | 第21页 |
·新词语的特征 | 第21-22页 |
·新词语的识别问题及对策 | 第22-23页 |
·基于INTERNET的新词语检测的目标和基本思想 | 第23-24页 |
·系统框图 | 第24-25页 |
·基于INTERNET的新词语检测的问题研究 | 第25-26页 |
第四章 重复串查找 | 第26-36页 |
·重复串查找问题概述 | 第26页 |
·现有的重复串查找算法 | 第26-30页 |
·后缀树算法 | 第26-28页 |
·Sequitur算法 | 第28-29页 |
·其他算法 | 第29-30页 |
·重复串查找算法 | 第30-33页 |
·算法原理 | 第30-32页 |
·算法描述 | 第32-33页 |
·算法的时间空间复杂度 | 第33-35页 |
·结论 | 第35-36页 |
第五章 提取网页的内容和日期 | 第36-41页 |
第六章 新词语查找 | 第41-46页 |
·基本原理 | 第41页 |
·数据库的结构 | 第41-43页 |
·背景数据库和过滤数据库的形成 | 第43-44页 |
·新词语查找 | 第44页 |
·优缺点讨论 | 第44-46页 |
第七章 新词语自动过滤和新词语词性猜测 | 第46-49页 |
·新词语自动过滤 | 第46-47页 |
·新词语词性猜测 | 第47-49页 |
第八章 实验效果以及分析 | 第49-54页 |
·对于重复串查找算法的实验 | 第49-50页 |
·提取网页的内容和日期的实验 | 第50页 |
·基于INTERNET新词语自动检测效果的实验 | 第50-54页 |
第九章 结束语 | 第54-55页 |
·本文总结 | 第54页 |
·今后的工作和改进 | 第54-55页 |
参考文献 | 第55-57页 |
致谢 | 第57-58页 |
作者简历 | 第58页 |