首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文机构名称的自动识别

0 引言第1-15页
 0.1 问题的提出第7-10页
  0.1.1 汉语自动分词的必要性第7页
  0.1.2 汉语自动分词中的困难第7-10页
 0.2 未登录词识别的研究现状第10-12页
 0.3 主要相关概念第12-13页
 0.4 本文的工作及其意义第13-15页
1 中文姓名与机构名称的对比研究第15-22页
 1.1 中文姓名的特点和前后文规律第15-17页
 1.2 中文姓名的识别模型第17-18页
 1.3 中文机构名称的特点第18-19页
 1.4 中文机构名称与中文姓名的对比第19-22页
  1.4.1 构成特点上的对比第19-20页
  1.4.2 识别方法上的对比第20-22页
2 统计为主、规则为辅的中文机构名称识别模型第22-31页
 2.1 识别范围的界定第22-23页
 2.2 机构名称识别的统计模型第23-28页
  2.2.1 机构名称特征词可信度模型第24-25页
  2.2.2 机构名称前部词可信度模型第25-26页
  2.2.3 机构名称构词可信度模型第26-27页
  2.2.4 单词构词可信度和双词接续可信度模型第27-28页
 2.3 机构名称识别的规则模型第28-31页
3 系统设计和实现第31-38页
 3.1 研究机构名称识别的总体工作流程第31-32页
 3.2 算法描述第32-38页
  3.2.1 机构名称识别算法ORG_IDENTIFY第32-33页
  3.2.2 建立潜在机构名链的算法CREATE_ORGLIST第33页
  3.2.3 判断机构名称前词的算法描述IS_ORGFORE第33-36页
  3.2.4 获得机构名称前部词可信度的算法描述GET_ORGPREX_FRQ第36-38页
4 实验结果与分析第38-46页
 4.1 实验结果第38-39页
 4.2 识别过程举例第39-42页
 4.3 测试结果分析第42-43页
 4.4 参数对识别结果的影响第43-46页
5 展望第46-48页
参考文献第48-50页
致谢第50-51页
附录第51-54页
 附录1 潜在机构名称的数据结构第51页
 附录2 中文机构名称识别所用到的参数第51-54页

论文共54页,点击 下载论文
上一篇:跨国公司顾客盈利能力管理
下一篇:异步电动机直接转矩控制系统的MATLAB仿真