首页--语言、文字论文--常用外国语论文--英语论文--语法论文

基于索引行聚类的英语动词型式自动识别与提取研究

致谢第5-8页
摘要第8-10页
Abstract第10-11页
第一章 引言第25-41页
    1.1 研究背景第25-28页
    1.2 本研究的理论及实践意义第28-33页
        1.2.1 论意义第28-30页
        1.2.2 实践意义第30-33页
    1.3 本研究概述第33-39页
        1.3.1 研究目的第33页
        1.3.2 研究问题及研究对象第33-34页
        1.3.3 研究步骤第34-39页
            1.3.3.1 语料及预处理第35页
            1.3.3.2 特征集的建立及其转换第35-37页
            1.3.3.3 权重计算第37-38页
            1.3.3.4 索引行聚类第38-39页
            1.3.3.5 型式提取第39页
    1.4 论文结构第39-40页
    1.5 小结第40-41页
第二章 型式与型式语法第41-65页
    2.1 型式第41-49页
        2.1.1 型式研究的缘起与发展第41-44页
        2.1.2 型式的定义第44-45页
        2.1.3 型式实例第45-46页
        2.1.4 型式元素及其编码第46-48页
        2.1.5 本研究中判别型式的六个标准第48-49页
    2.2 型式语法第49-58页
        2.2.1 短语学思想与习语原则第49-51页
        2.2.2 词汇与语法关系及各自地位第51-55页
            2.2.2.1 词汇语法不可分第51-53页
            2.2.2.2 词汇为中心的研究第53-55页
        2.2.3 型式与意义的关系第55-58页
    2.3 型式语法的优缺点第58-63页
        2.3.1 型式语法与传统语法差异第58-59页
        2.3.2 型式语法的优点第59-60页
        2.3.3 型式语法的不足第60-63页
    2.4 以型式语法为理论基础的相关研究第63-64页
    2.5 小结第64-65页
第三章 型式识别方法与相关应用研究第65-80页
    3.1 型式识别标准第65-66页
    3.2 型式总结的必要性第66-67页
    3.3 型式的识别第67-75页
        3.3.1 型式的人工识别第67-70页
        3.3.2 型式人工识别辅助工具的开发第70-71页
        3.3.3 型式的自动识别第71-75页
            3.3.3.1 型式自动识别的理据第71-73页
            3.3.3.2 型式的自动识别研究第73-75页
    3.4 现有的语言型式网络平台数据库第75-79页
        3.4.1 基于机器处理的网络数据库第76-77页
        3.4.2 基于人工处理的网络数据库第77-79页
    3.5 小结第79-80页
第四章 聚类分析第80-93页
    4.1 文本表示第81-82页
    4.2 特征选择及其权重第82-83页
        4.2.1 特征选择第82页
        4.2.2 权重计算第82-83页
    4.3 相似度计算第83-87页
        4.3.1 相似度计算的源起及理据第84页
        4.3.2 相似度计算方法第84-85页
        4.3.3 相似度分析在语言研究中的应用第85-87页
    4.4 聚类算法第87-90页
        4.4.1 划分聚类第87-89页
        4.4.2 层次聚类第89-90页
    4.5 聚类质量评价指标第90-91页
    4.6 聚类在本研究的应用理据第91-92页
    4.7 小结第92-93页
第五章 文本预处理与特征集的建立及转换第93-129页
    5.1 研究概述第93页
    5.2 语料选取第93-94页
    5.3 研究工具第94-95页
        5.3.1 语料预处理工具第94-95页
        5.3.2 自主开发的模块及脚本第95页
    5.4 语料预处理流程第95-97页
    5.5 动词型式中的必要元素及其转换方法第97-128页
        5.5.1 型式列表中元素的总体特征第98-100页
        5.5.2 具体词形的处理方法第100-114页
            5.5.2.1 右侧搭配词处理方法第100-113页
            5.5.2.2 左侧搭配词处理方法第113-114页
            5.5.2.3 两侧搭配词处理方法第114页
        5.5.3 相邻单词组合的处理方法第114-120页
        5.5.4 词类标签及语义类标签的转换方法第120-126页
            5.5.4.1 词类标签的转换方法第121-125页
            5.5.4.2 语义类标签转换方法第125-126页
        5.5.5 转换顺序及步骤第126-128页
    5.6 小结第128-129页
第六章 索引行聚类及型式自动提取方法第129-140页
    6.1 特征表示方法、特征权重与位置权重的计算第129-136页
        6.1.1 特征及特征权重第129-135页
            6.1.1.1 功能词处理方法第129-130页
            6.1.1.2 特征标记方法第130-131页
            6.1.1.3 型式边界的界定第131-133页
            6.1.1.4 索引行跨距的设定第133-134页
            6.1.1.5 特征权重计算方法第134-135页
        6.1.2 位置权重第135-136页
        6.1.3 特征-索引行矩阵的生成第136页
    6.2 聚类算法第136-139页
        6.2.1 相似度计算第136-137页
        6.2.2 K均值算法第137-139页
            6.2.2.1 K均值聚类第137-138页
            6.2.2.2 K值的选择标准第138-139页
    6.3 型式自动提取第139页
    6.4 小结第139-140页
第七章 型式自动提取模型测试第140-196页
    7.1 模型调试数据集及模型验证集的构建第140-145页
        7.1.1 调试阶段语料集合的构成第141-142页
        7.1.2 验证集的创建过程第142-145页
            7.1.2.1 验证集中词项的选择第143-144页
            7.1.2.2 验证集中索引行的抽取及处理方法第144-145页
    7.2 配置文件的处理及参数设置与调整第145-150页
        7.2.1 配置文件处理顺序第145-147页
        7.2.2 参数设置与调整第147-150页
            7.2.2.1 特征权重计算方法调试过程与解决方法第147-148页
            7.2.2.2 位置权重计算方法调试过程及解决方法第148-149页
            7.2.2.3 每个特征的总体权重计算方法第149页
            7.2.2.4 跨距设定调试过程第149-150页
    7.3 测试数据的评价指标第150-155页
        7.3.1 聚类内部效度评估指标在本研究中的应用第150-155页
        7.3.2 聚类外部效度评估指标在本研究中的应用第155页
    7.4 数据结果报告第155-184页
        7.4.1 索引行中型式及型式元素分布特征第155-162页
            7.4.1.1 型式元素总体分布特征第156-157页
            7.4.1.2 与动词高频共现的特征及其频数第157-160页
            7.4.1.3 不同动词型式列表中特征的异同第160-162页
        7.4.2 K值确定下基于现有人工标签的型式自动识别效度分析第162-170页
            7.4.2.1 验证集中型式自动识别外部效度评估结果总体描述第162-163页
            7.4.2.2 实验动词的型式自动识别准确率及召回率第163-170页
            7.4.2.3 K值确定下型式自动识别后的再思考第170页
        7.4.3 K值不确定下基于现有人工标签的型式自动识别效度分析第170-184页
            7.4.3.1 K值不确定下型式自动识别的外部效度测量结果总体描述第171-172页
            7.4.3.2 K值不确定下型式自动识别的准确率及召回率第172-183页
            7.4.3.3 K值未知情况下模型验证的再思考第183-184页
    7.5 分析和讨论第184-194页
        7.5.1 数据背后的语言学思考第184-188页
            7.5.1.1 印证了分布假设第184-185页
            7.5.1.2 印证了词汇语法不可分第185-186页
            7.5.1.3 型式元素间的横组合关系第186页
            7.5.1.4 常规型式与非常规型式第186-188页
        7.5.2 影响部分型式自动识别错误的原因第188-192页
            7.5.2.1 型式元素间的插入成分第188-190页
            7.5.2.2 无引导词THAT标志的从句识别第190页
            7.5.2.3 赋码错误第190-191页
            7.5.2.4 名词短语的识别问题第191-192页
        7.5.3 关于聚类外部效度测量结果的再思考第192-193页
        7.5.4 与前人研究结果的对比第193-194页
    7.6 小结第194-196页
第八章 英语动词型式自动提取模型的应用设想第196-207页
    8.1 应用范围第196-204页
        8.1.1 型式自动识别与提取在语言教学领域的应用第197-198页
            8.1.1.1 型式自动识别与提取在教学大纲制定中的应用第197页
            8.1.1.2 型式自动识别与提取在语言课堂教学中的应用第197-198页
            8.1.1.3 型式的自动识别与提取可以服务于学习者自主学习第198页
        8.1.2 型式自动识别与提取在语言研究中的应用第198-203页
            8.1.2.1 型式自动提取在词典编纂中的应用第198-199页
            8.1.2.2 型式自动提取模型对非常规用法的识别第199-200页
            8.1.2.3 型式自动识别在语言学研究中的应用第200-203页
        8.1.3 型式自动识别与提取在其他领域的应用可能第203-204页
    8.2 应用时需要注意的问题第204-206页
        8.2.1 语料及语料的赋码第204-205页
        8.2.2 聚类时参数的设置第205-206页
    8.3 小结第206-207页
第九章 研究发现及价值第207-223页
    9.1 研究发现第207-212页
        9.1.1 索引行聚类的影响因素及分组数量的选择第207-209页
            9.1.1.1 索引行聚类的影响因素第207-208页
            9.1.1.2 索引行聚类时簇数量的选择第208-209页
        9.1.2 型式自动识别的准确率及其影响因素第209-210页
            9.1.2.1 型式自动识别准确率的提高第209-210页
            9.1.2.2 影响部分型式自动识别错误的因素第210页
        9.1.3 不同动词索引行中型式元素的分布存在差异第210-212页
    9.2 研究价值及创新之处第212-220页
        9.2.1 理论方面第213-218页
            9.2.1.1 对型式语法的反哺第213-217页
            9.2.1.2 对其他语言学理论的贡献第217-218页
        9.2.2 方法论方面第218-219页
        9.2.3 实践方面第219-220页
    9.3 本研究的不足之处第220-221页
    9.4 未来研究方向第221-222页
    9.5 小结第222-223页
参考文献第223-239页
附录第239-249页

论文共249页,点击 下载论文
上一篇:自然环境模拟-树木建模方法研究
下一篇:扳带轧制过程控制系统及轧制力关键模型研究