信息技术领域字母词语提取研究
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 引言 | 第9-17页 |
·课题背景及研究意义 | 第9-11页 |
·字母词语提取的研究现状 | 第11-14页 |
·字母词语识别研究 | 第11-12页 |
·未登录词研究 | 第12-13页 |
·基本名词短语研究 | 第13-14页 |
·提取方法分析 | 第14页 |
·本文的研究内容 | 第14-15页 |
·语料的选择 | 第14-15页 |
·语料的获取及处理 | 第15页 |
·字母词语的研究及提取分析 | 第15页 |
·字母词语的知识库建设 | 第15页 |
·字母词语提取系统 | 第15页 |
·实验结果与分析 | 第15页 |
·文章的组织结构 | 第15-17页 |
第2章 字母词语的语言学研究及对提取的指导 | 第17-26页 |
·字母词语的界定 | 第17-19页 |
·语言学领域中字母词语的界定 | 第17-18页 |
·信息技术领域字母词语的界定 | 第18-19页 |
·字母词语的语法特征 | 第19-23页 |
·字母词语的构成 | 第19-20页 |
·字母词语的语法类别 | 第20-23页 |
·字母词语的相关语言学研究 | 第23-26页 |
·字母词语的归属 | 第23页 |
·字母词语的种类和结构方式 | 第23-24页 |
·字母词语的统计考察 | 第24页 |
·字母词语的规范 | 第24-25页 |
·字母词语的入典 | 第25-26页 |
第3章 字母词语考察及提取分析 | 第26-32页 |
·字母词语存在和使用情况的考察 | 第26-29页 |
·考察的范围 | 第26页 |
·字母词语中含有大量专名、术语 | 第26-27页 |
·字母词语中标点符号的使用 | 第27-29页 |
·字母词语的语形不规范 | 第29页 |
·字母词语的出现频率 | 第29页 |
·字母词语的提取分析 | 第29-32页 |
·字母词语中含有字母串 | 第30页 |
·字母词语是一个完整的语言单位 | 第30页 |
·字母词语提取的分析 | 第30-32页 |
第4章 字母词语提取方法 | 第32-43页 |
·基于转换的错误驱动的学习方法概述 | 第32-33页 |
·字母词语知识库建设 | 第33-35页 |
·汉字语素或汉语词库(HgC) | 第33-34页 |
·特征词库(Tc) | 第34页 |
·指界汉字语素或汉语词库(HzC) | 第34页 |
·汉字语素或汉语词词性库(HPC) | 第34-35页 |
·标点符号库(W) | 第35页 |
·初始标注 | 第35-39页 |
·分词和词性标注 | 第36页 |
·初始标注过程 | 第36页 |
·举例说明初始标注过程 | 第36-37页 |
·初始标注结果及分析 | 第37-39页 |
·规则的获取 | 第39-41页 |
·规则的获取模式 | 第39页 |
·本文获取的规则 | 第39-41页 |
·工作流程 | 第41-43页 |
第5章 实验结果与分析 | 第43-46页 |
·实验结果 | 第43页 |
·实验分析 | 第43-46页 |
·字母词语提取召回率的分析 | 第43页 |
·字母词语提取准确率的分析 | 第43-46页 |
第6章 结论与展望 | 第46-48页 |
·本文所做的工作 | 第46页 |
·结论 | 第46-47页 |
·展望 | 第47-48页 |
参考文献 | 第48-50页 |
附录 | 第50-52页 |
攻读硕士学位期间发表论文情况 | 第52-53页 |
致谢 | 第53页 |