第一章 绪论 | 第1-44页 |
·字母词语的界定 | 第16-20页 |
·研究的目标 | 第16页 |
·字母词语的界定 | 第16-20页 |
·研究内容 | 第20页 |
·论文研究的意义 | 第20-22页 |
·字母词语研究对于词汇使用规范的意义 | 第20-21页 |
·字母词语研究对于中文信息处理的意义 | 第21-22页 |
·字母词语与汉语词汇 | 第22-25页 |
·新词语、外来语与字母词语的关系 | 第22-24页 |
·汉语系统对字母词语的接纳能力 | 第24-25页 |
·相关文献综述 | 第25-41页 |
·字母词语(字母词)的语言学方面研究综述 | 第25-31页 |
·自然语言处理中自动提取和自动识别方法概述 | 第31-41页 |
·本文的研究 | 第41-42页 |
·论文的组织 | 第42-44页 |
第二章 ELWP自动识别的理论探讨 | 第44-51页 |
·ELWP和术语、专名、基本名词短语的关系 | 第44-46页 |
·ELWP与汉语普通词汇 | 第44页 |
·ELWP与术语的关系 | 第44-45页 |
·ELWP与专有名词的关系 | 第45-46页 |
·ELWP和基本名词短语 | 第46页 |
·ELWP和标点符号 | 第46-47页 |
·字母串与汉字串搭配的分合问题 | 第47-48页 |
·ELWP的语形不规范问题 | 第48页 |
·ELWP边界歧义 | 第48-49页 |
·字母串的合法性与ELWP之间的分割问题 | 第49页 |
·ELWP一次性出现的原因 | 第49-50页 |
·小结 | 第50-51页 |
第三章 ELWP的自动提取模型 | 第51-67页 |
·语料的选择及知识的获取 | 第51-54页 |
·DCC动态流通语料库 | 第51页 |
·语料的选择标准 | 第51-52页 |
·知识的获取 | 第52-54页 |
·数据稀疏问题的处理 | 第54-55页 |
·数据稀疏问题的一般处理方法 | 第54-55页 |
·ELWP数据稀疏问题的处理策略 | 第55页 |
·研究的步骤 | 第55-58页 |
·字母词语的统计特征 | 第56-58页 |
·ELWP自动提取的算法 | 第58-61页 |
·自动提取流程图 | 第58页 |
·字母串的处理 | 第58-59页 |
·预切分处理 | 第59页 |
·基于规则的ELWP提取算法 | 第59-60页 |
·含成对标点的ELWP提取 | 第60-61页 |
·基于统计的ELWP提取 | 第61页 |
·实验结果 | 第61-63页 |
·该模型的优缺点 | 第63-64页 |
·ELWP辅助校对系统 | 第64-66页 |
·校对系统的目标 | 第64页 |
·字母词语辅助校对系统的设计与实现 | 第64-66页 |
·小结 | 第66-67页 |
第四章 字母词语的自动标注模型 | 第67-79页 |
·引言 | 第67页 |
·采用错误驱动的学习方法获取字母词语识别的有关规则 | 第67-72页 |
·学习方法的确定 | 第67-69页 |
·本文的错误驱动算法 | 第69-71页 |
·本文的错误驱动算法与基于变换的错误驱动算法比较 | 第71页 |
·规则的获取 | 第71-72页 |
·ELWP搭配概率矩阵的获取 | 第72-75页 |
·几种抽词技术的分析 | 第73-74页 |
·DP系数与搭配概率矩阵的获取 | 第74-75页 |
·训练语料的标注 | 第75页 |
·自动标注算法 | 第75-76页 |
·实验及评测 | 第76-78页 |
·规则的获取实验 | 第76页 |
·自动标注ELWP实验及测试 | 第76-77页 |
·自动标注算法的缺陷及改进 | 第77-78页 |
·小结 | 第78-79页 |
第五章 ELWP概貌及统计分析 | 第79-98页 |
·ELWP的划分 | 第79-80页 |
·三种报纸ELWP的总体出现情况 | 第80页 |
·ELWP的不同报纸的情况对比 | 第80-93页 |
·《人民日报》中的ELWP | 第80-81页 |
·《北京青年报》中的ELWP | 第81-88页 |
·《羊城晚报》中的ELWP | 第88-91页 |
·各报纸共同出现ELWP的情况 | 第91-93页 |
·小结 | 第93页 |
·ELWP的组成成分及出现类型 | 第93-94页 |
·ELWP中的组成成分 | 第93页 |
·ELWP的出现类型 | 第93-94页 |
·ELWP的来源分析 | 第94-97页 |
·小结 | 第97-98页 |
第六章 ELWP专项考察 | 第98-123页 |
·单字母ELWP考察 | 第98-99页 |
·带汉字多字母ELWP考察 | 第99-101页 |
·含数字ELWP考察 | 第101-104页 |
·数字在字母前的情形 | 第102-103页 |
·数字在字母后的情形 | 第103-104页 |
·含数字ELWP之管见 | 第104页 |
·ELWP双语同现现象 | 第104-107页 |
·字母词语的并列结构 | 第107-109页 |
·ELWP的标点符号使用情况分析 | 第109-118页 |
·ELWP中的标点符号 | 第110页 |
·ELWP中标点符号出现情况及问题 | 第110-116页 |
·与标点相关问题的处理 | 第116-117页 |
·小结 | 第117-118页 |
·字母串光杆使用状况考察 | 第118-120页 |
·字母串光杆使用状况 | 第118-119页 |
·ELWP原文缩略和汉语拼音成词问题 | 第119-120页 |
·字母词语的词性问题 | 第120-121页 |
·ELWP不规范现象分析 | 第121-122页 |
·小结 | 第122-123页 |
第七章 字母词语释义初探 | 第123-132页 |
·引言 | 第123页 |
·字母词语释义的原则探讨 | 第123-125页 |
·字母词语释义模式的划分 | 第125-127页 |
·“是”字结构的字母词语释义模式 | 第127-129页 |
·字母词语释义自动提取的算法 | 第129页 |
·实验结果分析 | 第129-131页 |
·进一步的工作 | 第131-132页 |
第八章 结语 | 第132-138页 |
·存在的问题 | 第132-133页 |
·几点思考 | 第133-134页 |
·余论:关于字母词语入典的量化计算的设想 | 第134-138页 |
参考文献 | 第138-145页 |
附录说明 | 第145-146页 |
附录1:字母词语校对标准 | 第146-154页 |
附录2:《人民日报》字母词语总表(5090条)样例 | 第154-155页 |
附录3:《北京青年报》字母词语总表(46400条)样例 | 第155-156页 |
附录4:《羊城晚报》字母词语总表(10580条)样例 | 第156-157页 |
附录5:《北京青年报》-《人民日报》差集字母词语表(45233条)样例 | 第157-158页 |
附录6:《人民日报》-《北京青年报》差集字母词语表(3923条)样例 | 第158-159页 |
附录7:《北京青年报》-《羊城晚报》差集字母词语表(44152条)样例 | 第159-160页 |
附录8:《羊城晚报》-《北京青年报》差集字母词语表(8332条)样例 | 第160-161页 |
附录9:《人民日报》-《羊城晚报》差集字母词语表(4423条)样例 | 第161-162页 |
附录10:《羊城晚报》-《人民日报》差集字母词语表(9913条)样例 | 第162-163页 |
附录11:《人民日报》∩《北京青年报》字母词语表(1167条)样例 | 第163-164页 |
附录12:《人民日报》∩《羊城晚报》字母词语表(667条)样例 | 第164-165页 |
附录13.《北京青年报》∩《羊城晚报》字母词语表(2248条)样例 | 第165-166页 |
附录14:《北京青年报》一次性出现字母词语表(33682条)样例 | 第166-167页 |
附录15:《人民日报》一次性出现字母词语表(4034条)样例 | 第167-168页 |
附录16:《羊城晚报》一次性出现字母词语表(7066条)样例 | 第168-169页 |
附录17:三种报纸交集字母词语表(544条) | 第169-183页 |
附录18:《人民日报》单字母词语表(350条)样例 | 第183-184页 |
附录19:《人民日报》光杆字母词语(744条)样例 | 第184-185页 |
附录20:《人民日报》数字在前字母词语表(212条)样例 | 第185-186页 |
附录21:《人民日报》数字在后字母词语表(479条)样例 | 第186-187页 |
附录22:《人民日报》双语对照字母词语表(712条)样例 | 第187-188页 |
附录23:《人民日报》并列结构字母词语表(127条) | 第188-192页 |
附录24:《北京青年报》散布数排前200位的字母词语(200条)样例 | 第192-193页 |
攻读博士学位期间发表的学术论文 | 第193-194页 |
致谢 | 第194-195页 |