基于唐诗语料词的提取与统计分析的研究
| 内容提要 | 第1-8页 |
| 第一章 引言 | 第8-20页 |
| ·问题的提出 | 第8-9页 |
| ·计算语言学 | 第9-10页 |
| ·汉语语料库的建设 | 第10-13页 |
| ·已有的研究 | 第13-14页 |
| ·古籍电子化方向的相关研究 | 第13-14页 |
| ·国外语料库语言学的研究 | 第14页 |
| ·本文的出发点 | 第14-19页 |
| ·本论文所做的工作 | 第19-20页 |
| 第二章 唐诗语料数据库及知识库的建立 | 第20-26页 |
| ·语料库的物理结构 | 第20-21页 |
| ·物理数据库的选择 | 第21-22页 |
| ·唐诗相关语言知识库的建立 | 第22页 |
| ·唐诗语料数据库的建立 | 第22-25页 |
| ·小结 | 第25-26页 |
| 第三章 基于唐诗语料“词”的统计提取 | 第26-39页 |
| ·唐诗中‘词’的界定 | 第26页 |
| ·典型的词的提取方法 | 第26-27页 |
| ·基于统计的‘词’的提取方法 | 第27-37页 |
| ·语言研究中的统计学 | 第27-31页 |
| ·关于“互信息”和“共现度”的详细概念 | 第31-36页 |
| ·“结合强度”的提出 | 第36-37页 |
| ·‘多维度统计抽词模型’的建立 | 第37-38页 |
| ·小结 | 第38-39页 |
| 第四章 唐诗语料词语的切分 | 第39-55页 |
| ·现代汉语常用的分词方法 | 第39-41页 |
| ·基于字符串匹配的分词方法 | 第39页 |
| ·基于理解的分词方法 | 第39-40页 |
| ·基于统计的分词方法 | 第40-41页 |
| ·现代汉语分词过程中存在的歧义问题 | 第41-48页 |
| ·现代汉语中分词歧义的种类 | 第41-43页 |
| ·消除歧义的主要技术 | 第43-48页 |
| ·唐诗语料的词语切分 | 第48-53页 |
| ·运用唐诗特殊文体解决词语的切分 | 第48-52页 |
| ·唐诗语料切分时歧义问题的存在 | 第52-53页 |
| ·在唐诗语料库中消歧问题的解决 | 第53页 |
| ·小结 | 第53-55页 |
| 第五章 唐诗语料的词汇统计分析 | 第55-62页 |
| ·关于词汇的同现词与对偶词的研究 | 第55-57页 |
| ·同现词与对仗词的概念 | 第55-56页 |
| ·唐诗词汇的同现词与对仗词的统计 | 第56-57页 |
| ·词汇语义特征的研究 | 第57-59页 |
| ·词汇语义特征的统计描述 | 第57-58页 |
| ·词汇语义相似度的计算 | 第58-59页 |
| ·词汇以及词汇群落的时代变迁分析 | 第59-60页 |
| ·诗句的风格的相似检索 | 第60页 |
| ·小结 | 第60-62页 |
| 结论 | 第62-63页 |
| 参考文献 | 第63-65页 |
| 摘要 | 第65-67页 |
| Abstract | 第67-69页 |
| 致谢 | 第69页 |