基于唐诗语料词的提取与统计分析的研究
内容提要 | 第1-8页 |
第一章 引言 | 第8-20页 |
·问题的提出 | 第8-9页 |
·计算语言学 | 第9-10页 |
·汉语语料库的建设 | 第10-13页 |
·已有的研究 | 第13-14页 |
·古籍电子化方向的相关研究 | 第13-14页 |
·国外语料库语言学的研究 | 第14页 |
·本文的出发点 | 第14-19页 |
·本论文所做的工作 | 第19-20页 |
第二章 唐诗语料数据库及知识库的建立 | 第20-26页 |
·语料库的物理结构 | 第20-21页 |
·物理数据库的选择 | 第21-22页 |
·唐诗相关语言知识库的建立 | 第22页 |
·唐诗语料数据库的建立 | 第22-25页 |
·小结 | 第25-26页 |
第三章 基于唐诗语料“词”的统计提取 | 第26-39页 |
·唐诗中‘词’的界定 | 第26页 |
·典型的词的提取方法 | 第26-27页 |
·基于统计的‘词’的提取方法 | 第27-37页 |
·语言研究中的统计学 | 第27-31页 |
·关于“互信息”和“共现度”的详细概念 | 第31-36页 |
·“结合强度”的提出 | 第36-37页 |
·‘多维度统计抽词模型’的建立 | 第37-38页 |
·小结 | 第38-39页 |
第四章 唐诗语料词语的切分 | 第39-55页 |
·现代汉语常用的分词方法 | 第39-41页 |
·基于字符串匹配的分词方法 | 第39页 |
·基于理解的分词方法 | 第39-40页 |
·基于统计的分词方法 | 第40-41页 |
·现代汉语分词过程中存在的歧义问题 | 第41-48页 |
·现代汉语中分词歧义的种类 | 第41-43页 |
·消除歧义的主要技术 | 第43-48页 |
·唐诗语料的词语切分 | 第48-53页 |
·运用唐诗特殊文体解决词语的切分 | 第48-52页 |
·唐诗语料切分时歧义问题的存在 | 第52-53页 |
·在唐诗语料库中消歧问题的解决 | 第53页 |
·小结 | 第53-55页 |
第五章 唐诗语料的词汇统计分析 | 第55-62页 |
·关于词汇的同现词与对偶词的研究 | 第55-57页 |
·同现词与对仗词的概念 | 第55-56页 |
·唐诗词汇的同现词与对仗词的统计 | 第56-57页 |
·词汇语义特征的研究 | 第57-59页 |
·词汇语义特征的统计描述 | 第57-58页 |
·词汇语义相似度的计算 | 第58-59页 |
·词汇以及词汇群落的时代变迁分析 | 第59-60页 |
·诗句的风格的相似检索 | 第60页 |
·小结 | 第60-62页 |
结论 | 第62-63页 |
参考文献 | 第63-65页 |
摘要 | 第65-67页 |
Abstract | 第67-69页 |
致谢 | 第69页 |