首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义的多文种信息处理平台SMIPP的研究

中文摘要第1-5页
Abstract第5-13页
第一章 引言第13-26页
   ·问题的提出第13-18页
     ·世界全球化的发展趋势第14页
     ·Internet加速了信息处理的国际化第14-15页
     ·多民族、多文种的中国需要多文种信息处理第15页
     ·多文种信息处理研究的意义和价值第15-17页
     ·多文种信息处理平台第17-18页
   ·国内外现状第18-22页
     ·国内研究现状第18-19页
     ·国外研究现状第19-21页
     ·存在的问题和不足第21-22页
   ·本文的主要工作及解决的问题第22-24页
   ·本文的组织结构第24-26页
第二章 多文种信息处理技术概述第26-69页
   ·概述第26页
   ·国际化和本地化第26-33页
     ·国际化和本地化第26-28页
     ·国际化的内容第28-32页
       ·文字翻译第28页
       ·文化和语言特性第28-29页
       ·用户界面第29页
       ·文字输入和输出第29-30页
       ·字符和字形第30-31页
       ·字符编码方案和代码体系第31-32页
     ·国际化、本地化和多文种化第32-33页
   ·常用字符编码方案第33-61页
     ·基本概念第33-34页
     ·欧美拼音文字编码方案第34-40页
       ·ASCII第34-36页
       ·ISO 646第36页
       ·ISO 8859第36-38页
       ·其它拼音字符的编码方案第38-40页
     ·亚洲像形文字编码方案第40-51页
       ·ISO 2022第40-42页
       ·日文编码方案第42-44页
       ·韩文编码方案第44-45页
       ·越南文字代码体系第45-46页
       ·中国文字代码体系第46-51页
     ·多文种编码方案第51-53页
       ·单文种编码方案的缺点第51-52页
       ·多文种编码方案及其目标第52-53页
     ·多文种编码方案:Unicode和ISO 10646第53-60页
       ·Unicode和ISO 10646的历史第53页
       ·Unicode和ISO 10646的关系第53-55页
       ·Unicode的宗旨第55页
       ·Unicode和ISO 10646的编码规范第55-57页
       ·BMP和USC-2第57-58页
       ·Unicode的转换格式第58-60页
     ·其它支持多文种的其它平台第60-61页
   ·多文种信息处理平台第61-68页
     ·多文种信息处理平台概念和内容第62页
     ·目前多文种信息处理平台存在的问题第62-66页
     ·基于语义的多文种信息处理平台第66-68页
   ·本章小结第68-69页
第三章 基于语义的多文种代码体系SemaCode第69-109页
   ·现有的多文种代码体系第69-76页
     ·文本处理的语义需求和MetaData第69-71页
     ·Unicode代码体系第71-72页
     ·Unicode的缺陷第72-75页
     ·MetaCode结构第75-76页
     ·MetaCode的缺陷第76页
   ·以语义为轴心的多文种代码体系SemaCode第76-80页
     ·文字语义表示的挑战第76-77页
     ·SemaCode的基本思想第77-80页
     ·SemaCode模型第80页
   ·SemaCode各层的内容第80-101页
     ·物理存储层(Physical Storage Layer)第80-81页
     ·字符码位层(Character Code Point Layer)第81-86页
       ·Unicode的兼容字符、变形字符、多码位字符和复杂字符第81-82页
       ·SemaCode码位层的基本思想第82-83页
       ·字符码位定义第83-86页
     ·词码位层(Phrase Code Point Layer)第86-90页
     ·属性层(Property Layer)第90-95页
       ·XML和Unicode语言标签存在的问题第90-91页
       ·SemaCode标签定义第91-92页
       ·字符属性第92-95页
     ·语义层(Semantic Layer)第95-100页
       ·语义描述的方式第95-97页
       ·其它语义标签(Semantic Tags)第97页
       ·属性标签和语义标签的混用第97-98页
       ·语义的扩展(Extension)第98页
       ·字符的等价关系(Equivalencce)第98-100页
     ·交换/传输层(Exchange/Transmission Layer)第100页
     ·应用接口层(Application Interface Layer)第100-101页
   ·SemaCode和Unicode等的比较和分析第101-104页
     ·字符码位层第101-102页
     ·属性的表示第102-103页
     ·等价关系第103页
     ·语义表示第103-104页
     ·SemaCode的缺点第104页
   ·SemaCode和Unicode的转换和兼容性分析第104-108页
     ·SemaCode和Unicode转换第105-107页
     ·SemaCode和其它代码的转换第107页
     ·用SemaCode直接表示其它编码方案第107-108页
   ·本章小结第108-109页
第四章 基于语义的多文种信息处理平台SMIPP模型第109-163页
   ·现有的多文种信息处理平台第109-116页
     ·Windows多文种环境(Windows Multilingual Environment)第109-111页
     ·Linux国际化框架(Linux Internationalisation Architecture)第111-112页
     ·NJStar Communicator第112-113页
     ·中国少数民族多文种处理平台第113-116页
       ·“炎黄”中文平台第113-115页
       ·维、哈、柯、汉、英多文种处理平台第115-116页
   ·基于语义的多文种信息处理平台模型SMIPP第116-124页
     ·多文种信息处理平台的设计目标第116-119页
     ·SMIPP模型第119-120页
     ·SMIPP模型的组成第120-124页
       ·应用程序/用户接口层第120-122页
       ·文字输入层和文字输出层第122页
       ·信息处理服务层第122页
       ·语料库层第122-123页
       ·SemaCode第123-124页
       ·Ontology第124页
   ·面向SMIPP的Ontology第124-139页
     ·什么是Ontology第124-126页
     ·Ontology在SMIPP中的意义和设计目标第126-127页
     ·Ontology需要解决的问题和总体设计思想第127页
     ·面向SMIPP的Ontology的形式化定义第127-131页
     ·面向SMIPP的Ontology的结构和表示方法第131-138页
       ·Ontology的结构第131-134页
       ·Ontology的构建和表示方法第134-137页
       ·一个例子第137-138页
     ·面向SMIPP的Ontology的语义相似度计算第138-139页
   ·面向SMIPP的语料库第139-160页
     ·语料库研究的现状第139-141页
     ·面向SMIPP语料库的设计思想第141-142页
     ·Wiki的信息收集方法第142-144页
     ·信息网格技术第144-145页
     ·语料的收集方法第145-147页
     ·基于信息网格的语料库建设和发布模型第147-150页
     ·面向SMIPP语料库的收集和整理第150-155页
     ·语料的可信度计算和分析第155-160页
       ·可信度定义第155-157页
       ·基于算法的语料可信度第157-158页
       ·基于用户的语料可信度第158-160页
   ·SMIPP和现有平台的对比第160-162页
     ·SMIPP的优势第160页
     ·SMIPP的不足第160-161页
     ·SMIPP和现有平台对比表第161-162页
   ·本章小结第162-163页
第五章 SMIPP的输入和输出模型及其分析第163-215页
   ·文字输入/输出技术概述第163-167页
     ·文字输入/输出概述第163-164页
     ·文字输入技术目前存在的问题第164-165页
     ·文字输出技术目前存在的问题第165-167页
   ·SMIPP输入和输出模型第167-179页
     ·基本思想第167-168页
     ·SMIPP的输入模型第168-172页
     ·语言模型的个性化第172-174页
     ·语言模型的普适性第174-176页
     ·新词的收集第176-179页
     ·SMIPP的输出模型第179页
   ·文字内码自动识别技术第179-196页
     ·文字内码自动识别概述第180-181页
     ·现有的文字内码识别方法第181-183页
     ·文字内码自动识别算法第183-186页
     ·字符串内码编码方案和文种自动识别算法第186-193页
       ·算法设计思想第186-187页
       ·算法的准备第187-189页
       ·单个字符串的编码方案和文种自动识别算法第189-193页
     ·实验和算法分析第193-196页
   ·双向文字处理技术第196-213页
     ·双向文字概述第196-200页
       ·阿拉伯和希伯来文字第196-198页
       ·蒙古文字第198页
       ·双向文字第198-199页
       ·双向文字存在的问题第199-200页
     ·现有的双向文字解决方法第200-202页
       ·常用双向文字解决方法第201页
       ·显/隐式的双向文字识别算法第201-202页
     ·SMIPP的双向文字处理算法SBidi(SMIPP Bidirectional Algorithm)第202-209页
     ·测试和例子第209-213页
   ·语义信息的获取第213-214页
   ·本章总结第214-215页
第六章 总结和展望第215-229页
   ·本文总结第215-216页
   ·本文的贡献和创新第216-218页
   ·下一步的工作第218-229页
攻读博士学位期间相关的科研情况第229-230页
攻读博士学位期间发表的相关论文第230-233页
致谢第233-234页
中文详细摘要第234-250页

论文共250页,点击 下载论文
上一篇:软骨下骨改变在骨关节炎中的作用及二磷酸盐干预效应的实验研究
下一篇:民国时期自然灾害救治社会化研究--以1931年大水灾为重点的考察