| 摘要 | 第1-5页 |
| Abstract | 第5-10页 |
| 第一章 引论 | 第10-20页 |
| ·定义“有效字符串”的背景 | 第10-15页 |
| ·传统语言学关于“词”、“短语”的研究 | 第10页 |
| ·计算语言学与短语有关的研究 | 第10-11页 |
| ·“关键词提取”(Keyword Extraction)的研究 | 第11页 |
| ·“组块理论”和“汉语组块”的研究 | 第11-12页 |
| ·心理学关于“认知”、“眼动”和阅读理论的研究 | 第12页 |
| ·定义“有效字符串”的认知心理学和认知语言学背景 | 第12-14页 |
| ·“有效字符串(VSt)”的语法特征 | 第14-15页 |
| ·关于定义“有效字符串(VSt)”的基本原则 | 第15-16页 |
| ·“有效字符串(VSt)”的定位 | 第15-16页 |
| ·“有效字符串(VSt)”与“流通度” | 第16页 |
| ·“有效字符串(VSt)”与“短时记忆” | 第16页 |
| ·“有效字符串(VSt)”的形式 | 第16页 |
| ·“有效字符串”与既有相关概念的区别和联系 | 第16-18页 |
| ·“有效字符串(VSt)”与“词”、“词组/短语”的区别和联系 | 第17页 |
| ·“有效字符串(VSt)”与“关键词”的区别和联系 | 第17页 |
| ·“有效字符串(VSt)”与“汉语组块”的区别和联系 | 第17-18页 |
| ·定义“有效字符串(VSt)”的意义 | 第18-19页 |
| ·语言监控 | 第18页 |
| ·未登录词语和新词语 | 第18页 |
| ·信息提取 | 第18页 |
| ·机器翻译 | 第18-19页 |
| ·本研究的目标 | 第19页 |
| ·本研究的意义 | 第19页 |
| ·本研究的创新点和难点 | 第19-20页 |
| 第二章 “动态流通语料库(DCC)”研究背景和现状 | 第20-30页 |
| ·传统语料库和动态流通语料库 | 第20-23页 |
| ·传统语料库 | 第20-21页 |
| ·动态流通语料库的理论背景 | 第21-22页 |
| ·两种语料库的区别和联系 | 第22-23页 |
| ·关于汉语自动分词方法 | 第23-25页 |
| ·传统分词算法的种类、特色 | 第23-24页 |
| ·传统分词方式难点 | 第24-25页 |
| ·动态流通语料库对传统分词的利用 | 第25页 |
| ·新词语研究 | 第25-26页 |
| ·“动态流通语料库(DCC)”研究现状 | 第26-30页 |
| ·“动态语言知识更新”的理论和方法 | 第26-27页 |
| ·“动态流通语料库(DCC)”的建造 | 第27-30页 |
| 第三章 动态流通语料库(DCC)的理论和方法 | 第30-40页 |
| ·流通度与媒体 | 第30-31页 |
| ·媒体流通度与文本流通度的关系 | 第30页 |
| ·确定媒体流通度的标准 | 第30页 |
| ·关于分析的可信度 | 第30-31页 |
| ·“动态流通语料库(DCC)”的核心--“句碎片”库 | 第31-40页 |
| ·切分“句碎片” | 第31页 |
| ·以“句碎片”库为核心建造“动态流通语料库(DCC)” | 第31-33页 |
| ·“流通度”的量化研究 | 第33-34页 |
| ·计算“有效字符串”走势曲线 | 第34-36页 |
| ·处理方法的探索 | 第36-37页 |
| ·处理方法的改进 | 第37-40页 |
| 第四章 “有效字符串(VSt)”提取方法研究 | 第40-58页 |
| ·“句碎片”库 | 第40-41页 |
| ·“句碎片”分词 | 第41-44页 |
| ·“已知字符串”走势曲线类型研究 | 第44-51页 |
| ·分词“句碎片”捆绑 | 第51-54页 |
| ·“X串”处理 | 第54-55页 |
| ·“有效字符串(VSt)”库 | 第55-58页 |
| 第五章 系统处理模块 | 第58-64页 |
| ·总体处理流程 | 第58页 |
| ·系统模块简介 | 第58-64页 |
| ·“DCC”一体化处理系统 | 第58-59页 |
| ·“备选字符串”捆绑处理系统 | 第59-60页 |
| ·“有效字符串(VSt)”提取系统 | 第60页 |
| ·“X串”和新词语处理系统 | 第60-61页 |
| ·“有效字符串(VSt)”后处理模块 | 第61-64页 |
| 第六章 “有效字符串(VSt)”提取实验 | 第64-68页 |
| ·“平行”模式提取实验 | 第64-66页 |
| ·“突现”模式提取实验 | 第66页 |
| ·“波浪”模式提取实验 | 第66-68页 |
| 第七章 存在的问题和下一步工作 | 第68-72页 |
| ·存在的问题 | 第68-69页 |
| ·“曲线关系”模式的研究 | 第68页 |
| ·“曲线”本身的性质 | 第68页 |
| ·关于“捆绑”策略 | 第68-69页 |
| ·下一步工作 | 第69-72页 |
| ·“走势曲线”模式库 | 第69页 |
| ·“有效字符串(VSt)”分级 | 第69页 |
| ·制定“有效字符串(VSt)”的分类体系 | 第69-70页 |
| ·应用研究 | 第70-72页 |
| 参考文献 | 第72-80页 |
| 附录一 | 第80-96页 |
| 附录二 | 第96-122页 |
| 附录三 | 第122-154页 |
| 附录四 | 第154-168页 |
| 附录五 | 第168-172页 |
| 附录六 | 第172-183页 |
| 致谢 | 第183页 |