首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于唐诗语料词的提取与统计分析的研究

内容提要第1-8页
第一章 引言第8-20页
   ·问题的提出第8-9页
   ·计算语言学第9-10页
   ·汉语语料库的建设第10-13页
   ·已有的研究第13-14页
     ·古籍电子化方向的相关研究第13-14页
     ·国外语料库语言学的研究第14页
   ·本文的出发点第14-19页
   ·本论文所做的工作第19-20页
第二章 唐诗语料数据库及知识库的建立第20-26页
   ·语料库的物理结构第20-21页
   ·物理数据库的选择第21-22页
   ·唐诗相关语言知识库的建立第22页
   ·唐诗语料数据库的建立第22-25页
   ·小结第25-26页
第三章 基于唐诗语料“词”的统计提取第26-39页
   ·唐诗中‘词’的界定第26页
   ·典型的词的提取方法第26-27页
   ·基于统计的‘词’的提取方法第27-37页
     ·语言研究中的统计学第27-31页
     ·关于“互信息”和“共现度”的详细概念第31-36页
     ·“结合强度”的提出第36-37页
   ·‘多维度统计抽词模型’的建立第37-38页
   ·小结第38-39页
第四章 唐诗语料词语的切分第39-55页
   ·现代汉语常用的分词方法第39-41页
     ·基于字符串匹配的分词方法第39页
     ·基于理解的分词方法第39-40页
     ·基于统计的分词方法第40-41页
   ·现代汉语分词过程中存在的歧义问题第41-48页
     ·现代汉语中分词歧义的种类第41-43页
     ·消除歧义的主要技术第43-48页
   ·唐诗语料的词语切分第48-53页
     ·运用唐诗特殊文体解决词语的切分第48-52页
     ·唐诗语料切分时歧义问题的存在第52-53页
     ·在唐诗语料库中消歧问题的解决第53页
   ·小结第53-55页
第五章 唐诗语料的词汇统计分析第55-62页
   ·关于词汇的同现词与对偶词的研究第55-57页
     ·同现词与对仗词的概念第55-56页
     ·唐诗词汇的同现词与对仗词的统计第56-57页
   ·词汇语义特征的研究第57-59页
     ·词汇语义特征的统计描述第57-58页
     ·词汇语义相似度的计算第58-59页
   ·词汇以及词汇群落的时代变迁分析第59-60页
   ·诗句的风格的相似检索第60页
   ·小结第60-62页
结论第62-63页
参考文献第63-65页
摘要第65-67页
Abstract第67-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:分体式箱梁桥的受力分析和设计计算方法研究
下一篇:论公共部门人力资源管理的公平价值取向