首页--语言、文字论文--语言学论文--应用语言学论文

基于生成性词库分词技术的汉语拼音自动转换研究

摘要第1-4页
ABSTRACT第4-8页
1 绪论第8-21页
   ·研究的内容和意义第8-10页
   ·研究的方法和步骤第10-11页
   ·汉语拼音自动转换研究的现状第11-14页
     ·汉语文本自动标注拼音软件第11页
     ·汉语拼音标注工具1.92版本第11-13页
     ·微软Word中的拼音指南第13-14页
   ·汉语文本自动分词研究的现状第14-17页
     ·国际互联网汉语信息处理第14-17页
     ·其他自动分词技术第17页
   ·自动分词算法研究的现状第17-21页
     ·机械匹配算法第17-19页
     ·特征词算法第19-20页
     ·词性、语义分类约束算法第20-21页
     ·语法分析算法第21页
2 生成性词库自动分词的原理第21-36页
   ·罗海清的生成性词库分词技术第22-24页
   ·生成性词库分词技术的改进第24-25页
   ·真实语料的选择和采集第25-26页
   ·扩大隐性词库的规模第26-29页
   ·生成性构词表的组织和完善第29-30页
   ·扩大生成性词库的词的容量第30-31页
   ·为其他语言学研究提供扩展接口第31-32页
   ·扩大字符集处理能力第32-33页
   ·分词处理流程第33-36页
     ·自动分词流程设计第33-34页
     ·流程说明第34-36页
3 汉语拼音自动转换设计第36-45页
   ·多音字的自动识别第36-37页
   ·语料库设计第37-39页
   ·贯彻正词法标准第39-42页
   ·音变的研究第42-43页
     ·"啊"的音变第42页
     ·"一'、"七"、"八"、"不'的音变第42-43页
   ·算法设计第43-45页
     ·多音字识别流程第43-44页
     ·流程说明第44-45页
4 程序说明第45-113页
   ·算法设计第45-60页
     ·算法基础第45-46页
     ·有关语言信息处理的算法第46-60页
   ·主要函数模块的定义第60-67页
     ·程序的入口第60-61页
     ·分词处理模块第61页
     ·标注汉语拼音第61-62页
     ·处理儿化音第62页
     ·处理a(啊)的音变第62-63页
     ·截取子字符串第63页
     ·多字词后缀的识别第63-64页
     ·多字词的歧义匹配和处理第64页
     ·3字词的歧义匹配和处理第64页
     ·在多字词库中匹配第64-65页
     ·在3字词库中匹配第65-66页
     ·识别基本语素第66页
     ·匹配基本语素的前加语素第66页
     ·匹配基本语素的后加语素第66-67页
     ·汉字字符串处理函数第67页
   ·自动分词算法的代码分析第67-86页
     ·API接口函数第68-72页
     ·分词模块第72-79页
     ·截取子字符串模块第79页
     ·匹配3字词模块第79-80页
     ·匹配多字词模块第80-81页
     ·匹配多字词大于4个汉字的字符第81-83页
     ·基于统计的歧义处理模块第83-84页
     ·匹配基本语素第84-86页
   ·汉语拼音转换的代码分析第86-109页
     ·拼音自动转换主模块第86-92页
     ·计算指定汉字字符串的拼音第92-96页
     ·查找多音字的缺省读音第96-97页
     ·在多音字主表中定位第97-98页
     ·在多音字次表中定位指定的汉字第98-99页
     ·确定多音字的读音第99-101页
     ·组装拼音字符串第101-102页
     ·啊(a)的变音处理第102-104页
     ·处理儿化读音第104-107页
     ·查找多字词和特殊2字词的读音第107-108页
     ·取给定字符串在韵母表中偏移位置第108-109页
     ·截取子字符串第109页
   ·汉字字符串处理函数第109-113页
     ·拼接字符串第109-110页
     ·从目标字符串的指定位置开始,连接源字符串第110页
     ·连接分词结果字符串第110页
     ·比较指定长度的2个无符号字符串第110-111页
     ·比较2个有符号字符串的第111页
     ·复制字符串第111页
     ·计算字符串的长度第111-112页
     ·复制指定位置字符串第112页
     ·比较2个字符串是否相同第112-113页
5 结论第113-115页
   ·论文取得的主要成果和不足第113页
   ·本研究的理论和应用价值展望第113-115页
【附录1】:基本语素构词表第115-148页
【附录2】:多音字缺省读音总表第148-151页
【附录3】:汉字多音字音节总表第151-158页
参考文献第158-160页
攻读硕士期间发表的学术论文第160-161页
致谢第161-163页

论文共163页,点击 下载论文
上一篇:“三礼”数量短语考察
下一篇:语言学概论语音部分网络精品课程建设研究