首页--语言、文字论文--语言学论文--应用语言学论文--数理语言学论文

基于动态流通语料库(DCC)的汉语字母词语识别及考察研究

第一章 绪论第1-44页
   ·字母词语的界定第16-20页
     ·研究的目标第16页
     ·字母词语的界定第16-20页
     ·研究内容第20页
   ·论文研究的意义第20-22页
     ·字母词语研究对于词汇使用规范的意义第20-21页
     ·字母词语研究对于中文信息处理的意义第21-22页
   ·字母词语与汉语词汇第22-25页
     ·新词语、外来语与字母词语的关系第22-24页
     ·汉语系统对字母词语的接纳能力第24-25页
   ·相关文献综述第25-41页
     ·字母词语(字母词)的语言学方面研究综述第25-31页
     ·自然语言处理中自动提取和自动识别方法概述第31-41页
   ·本文的研究第41-42页
   ·论文的组织第42-44页
第二章 ELWP自动识别的理论探讨第44-51页
   ·ELWP和术语、专名、基本名词短语的关系第44-46页
     ·ELWP与汉语普通词汇第44页
     ·ELWP与术语的关系第44-45页
     ·ELWP与专有名词的关系第45-46页
     ·ELWP和基本名词短语第46页
   ·ELWP和标点符号第46-47页
   ·字母串与汉字串搭配的分合问题第47-48页
   ·ELWP的语形不规范问题第48页
   ·ELWP边界歧义第48-49页
   ·字母串的合法性与ELWP之间的分割问题第49页
   ·ELWP一次性出现的原因第49-50页
   ·小结第50-51页
第三章 ELWP的自动提取模型第51-67页
   ·语料的选择及知识的获取第51-54页
     ·DCC动态流通语料库第51页
     ·语料的选择标准第51-52页
     ·知识的获取第52-54页
   ·数据稀疏问题的处理第54-55页
     ·数据稀疏问题的一般处理方法第54-55页
     ·ELWP数据稀疏问题的处理策略第55页
   ·研究的步骤第55-58页
     ·字母词语的统计特征第56-58页
   ·ELWP自动提取的算法第58-61页
     ·自动提取流程图第58页
     ·字母串的处理第58-59页
     ·预切分处理第59页
     ·基于规则的ELWP提取算法第59-60页
     ·含成对标点的ELWP提取第60-61页
     ·基于统计的ELWP提取第61页
   ·实验结果第61-63页
   ·该模型的优缺点第63-64页
   ·ELWP辅助校对系统第64-66页
     ·校对系统的目标第64页
     ·字母词语辅助校对系统的设计与实现第64-66页
   ·小结第66-67页
第四章 字母词语的自动标注模型第67-79页
   ·引言第67页
   ·采用错误驱动的学习方法获取字母词语识别的有关规则第67-72页
     ·学习方法的确定第67-69页
     ·本文的错误驱动算法第69-71页
     ·本文的错误驱动算法与基于变换的错误驱动算法比较第71页
     ·规则的获取第71-72页
   ·ELWP搭配概率矩阵的获取第72-75页
     ·几种抽词技术的分析第73-74页
     ·DP系数与搭配概率矩阵的获取第74-75页
   ·训练语料的标注第75页
   ·自动标注算法第75-76页
   ·实验及评测第76-78页
     ·规则的获取实验第76页
     ·自动标注ELWP实验及测试第76-77页
     ·自动标注算法的缺陷及改进第77-78页
   ·小结第78-79页
第五章 ELWP概貌及统计分析第79-98页
   ·ELWP的划分第79-80页
   ·三种报纸ELWP的总体出现情况第80页
   ·ELWP的不同报纸的情况对比第80-93页
     ·《人民日报》中的ELWP第80-81页
     ·《北京青年报》中的ELWP第81-88页
     ·《羊城晚报》中的ELWP第88-91页
     ·各报纸共同出现ELWP的情况第91-93页
     ·小结第93页
   ·ELWP的组成成分及出现类型第93-94页
     ·ELWP中的组成成分第93页
     ·ELWP的出现类型第93-94页
   ·ELWP的来源分析第94-97页
   ·小结第97-98页
第六章 ELWP专项考察第98-123页
   ·单字母ELWP考察第98-99页
   ·带汉字多字母ELWP考察第99-101页
   ·含数字ELWP考察第101-104页
     ·数字在字母前的情形第102-103页
     ·数字在字母后的情形第103-104页
     ·含数字ELWP之管见第104页
   ·ELWP双语同现现象第104-107页
   ·字母词语的并列结构第107-109页
   ·ELWP的标点符号使用情况分析第109-118页
     ·ELWP中的标点符号第110页
     ·ELWP中标点符号出现情况及问题第110-116页
     ·与标点相关问题的处理第116-117页
     ·小结第117-118页
   ·字母串光杆使用状况考察第118-120页
     ·字母串光杆使用状况第118-119页
     ·ELWP原文缩略和汉语拼音成词问题第119-120页
   ·字母词语的词性问题第120-121页
   ·ELWP不规范现象分析第121-122页
   ·小结第122-123页
第七章 字母词语释义初探第123-132页
   ·引言第123页
   ·字母词语释义的原则探讨第123-125页
   ·字母词语释义模式的划分第125-127页
   ·“是”字结构的字母词语释义模式第127-129页
   ·字母词语释义自动提取的算法第129页
   ·实验结果分析第129-131页
   ·进一步的工作第131-132页
第八章 结语第132-138页
   ·存在的问题第132-133页
   ·几点思考第133-134页
   ·余论:关于字母词语入典的量化计算的设想第134-138页
参考文献第138-145页
附录说明第145-146页
附录1:字母词语校对标准第146-154页
附录2:《人民日报》字母词语总表(5090条)样例第154-155页
附录3:《北京青年报》字母词语总表(46400条)样例第155-156页
附录4:《羊城晚报》字母词语总表(10580条)样例第156-157页
附录5:《北京青年报》-《人民日报》差集字母词语表(45233条)样例第157-158页
附录6:《人民日报》-《北京青年报》差集字母词语表(3923条)样例第158-159页
附录7:《北京青年报》-《羊城晚报》差集字母词语表(44152条)样例第159-160页
附录8:《羊城晚报》-《北京青年报》差集字母词语表(8332条)样例第160-161页
附录9:《人民日报》-《羊城晚报》差集字母词语表(4423条)样例第161-162页
附录10:《羊城晚报》-《人民日报》差集字母词语表(9913条)样例第162-163页
附录11:《人民日报》∩《北京青年报》字母词语表(1167条)样例第163-164页
附录12:《人民日报》∩《羊城晚报》字母词语表(667条)样例第164-165页
附录13.《北京青年报》∩《羊城晚报》字母词语表(2248条)样例第165-166页
附录14:《北京青年报》一次性出现字母词语表(33682条)样例第166-167页
附录15:《人民日报》一次性出现字母词语表(4034条)样例第167-168页
附录16:《羊城晚报》一次性出现字母词语表(7066条)样例第168-169页
附录17:三种报纸交集字母词语表(544条)第169-183页
附录18:《人民日报》单字母词语表(350条)样例第183-184页
附录19:《人民日报》光杆字母词语(744条)样例第184-185页
附录20:《人民日报》数字在前字母词语表(212条)样例第185-186页
附录21:《人民日报》数字在后字母词语表(479条)样例第186-187页
附录22:《人民日报》双语对照字母词语表(712条)样例第187-188页
附录23:《人民日报》并列结构字母词语表(127条)第188-192页
附录24:《北京青年报》散布数排前200位的字母词语(200条)样例第192-193页
攻读博士学位期间发表的学术论文第193-194页
致谢第194-195页

论文共195页,点击 下载论文
上一篇:中国上市航空公司财务状况及经营效率分析
下一篇:方太厨具公司的品牌战略研究