首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

从大规模Web语料中获取常识语料

摘要第1-7页
英文摘要第7-9页
目录第9-12页
图目录第12-13页
表目录第13-15页
第一章 引言第15-27页
   ·文本常识获取的研究意义第15-16页
   ·常识获取的研究现状第16-21页
     ·常识的集中式人工获取——Cyc第16-17页
     ·常识的公众获取——OMCS第17页
     ·通过类比来获取常识第17-18页
     ·从文本中自动获取常识第18-21页
   ·文本常识获取相关理论和技术第21-22页
     ·Web 上的信息抽取第21页
     ·机器阅读第21-22页
   ·Web 语料常识获取面临的困难第22-24页
   ·关于本论文第24-27页
     ·主要研究内容第24-25页
     ·论文组织第25-27页
第二章 从Web 语料手工获取常识的实验第27-37页
   ·实验目的第27页
   ·实验过程第27-29页
   ·实验结果分析第29-33页
     ·一致性检验第29-30页
     ·相合性检验第30-32页
     ·获取结果相似性检验第32-33页
   ·刻画句子的常识获取合适程度的两个特征第33-37页
     ·语义相关词的共现率第33-34页
     ·体词的认知显著性第34-37页
第三章 从Web 语料筛选品优句子第37-43页
   ·从Web 网页抽取句子第37页
   ·句子的词级别预处理第37-40页
     ·分词和词性标注第37-38页
     ·词性标记处理策略第38-39页
     ·命名实体处理策略第39页
     ·古文处理策略第39-40页
   ·品优句子筛选规则第40-43页
第四章 从Web 语料获取带权词汇网络第43-59页
   ·词汇网络第43-45页
     ·词汇网络与常识获取第43-44页
     ·相关的语言网络研究第44-45页
   ·带权词汇网络的获取第45-56页
     ·带权词汇网络中的词第45-46页
     ·带权词汇网络中的词性二元搭配关系第46-53页
     ·带权词汇网络训练算法第53-54页
     ·带权词汇网络清洗算法第54-56页
   ·带权词汇网络与语言模型和依存语法的比较第56-59页
第五章 体词的认知显著性第59-65页
   ·基本层次范畴第59-60页
   ·基于Web 语料的体词认知显著性度量第60-65页
     ·基于Web 语料的体词关系网络第61-62页
     ·根据体词关系网络计算认知显著性第62-65页
第六章 句子的常识获取合适程度分析第65-83页
   ·句子词汇网络第65-68页
   ·句子的常识获取难度分析第68-72页
     ·基于句子词汇网络的特征提取第69-70页
     ·基于体词认知显著性的特征提取第70页
     ·实验结果与分析第70-72页
   ·句子的常识丰富度分析第72-83页
     ·极小语义成分第72-78页
     ·语义成分的概率估计第78页
     ·极小语义成分的扩展第78-83页
第七章 结束语及进一步研究第83-87页
附录1 允许语气词第87-89页
附录2 允许助词第89-91页
附录3 允许拟声词第91-93页
附录4 允许叹词第93-95页
附录5 允许简称(部分)第95-97页
附录6 允许前接成分第97-99页
附录7 允许后接成分第99-101页
附录8 允许处所词(部分)第101-103页
附录9 允许体词性习用语(部分)第103-105页
附录10 允许谓词性习用语(部分)第105-107页
附录11 禁止单字词(部分)第107-109页
附录12 类型确定代词第109-111页
附录13 常识时间词(部分)第111-113页
附录14 并列连词第113-115页
附录15 否定副词第115-117页
附录16 具有否定意义的形容词第117-119页
附录17 具有否定意义的动词第119-121页
参考文献第121-126页
致谢第126-127页
作者简介第127页

论文共127页,点击 下载论文
上一篇:平流层飞艇高效螺旋桨设计与试验研究
下一篇:猪Toll样受体7基因的克隆、表达及其结构与功能预测分析