1、基于统计和规则混合策略的中国人名识别研究 | 第1-39页 |
摘要 | 第5-7页 |
第一章 引言 | 第7-13页 |
·研究背景及研究意义 | 第7-8页 |
·研究对象 | 第8页 |
·中国人名识别的难点 | 第8-9页 |
·国内外研究历史及现状 | 第9-11页 |
·论文的主要工作 | 第11-12页 |
·论文组织结构 | 第12-13页 |
第二章 知识库及前期准备工作 | 第13-18页 |
·中国人名构成的特点 | 第13-14页 |
·中文分词软件 | 第14-15页 |
·姓氏资源库 | 第15页 |
·人名用字知识库 | 第15-16页 |
·其他辅助资源 | 第16-18页 |
第三章 候选人名的提取 | 第18-23页 |
·Zipf法则 | 第18-20页 |
·Zipf法则在本文中的应用 | 第20-21页 |
·候选人名提取方法 | 第21-22页 |
·平滑机制 | 第22-23页 |
第四章 特征提取和规则施加 | 第23-29页 |
·内部特征 | 第23-24页 |
·外部特征 | 第24-25页 |
·识别规则 | 第25-29页 |
第五章 系统模型及实验结果分析 | 第29-32页 |
·系统模型 | 第29页 |
·实验结果 | 第29-30页 |
·实验结果分析 | 第30-32页 |
第六章 总结与展望 | 第32-34页 |
参考文献 | 第34-37页 |
附录 | 第37-39页 |
2、中文未登录词识别技术研究 | 第39-70页 |
第一章 引言 | 第42-47页 |
·IE(信息提取)技术简介 | 第42-43页 |
·中文分词 | 第43-44页 |
·关于中文分词 | 第43页 |
·中文分词的关键问题 | 第43-44页 |
·未登录词定义 | 第44-45页 |
·未登录词识别的难点 | 第45-47页 |
第二章 英文NE识别历史及现状 | 第47-51页 |
·识别历史 | 第47页 |
·隐马尔可夫模型(Hidden Markov Model,HMM) | 第47-48页 |
·支撑向量机(Support Vector Machine,SVM) | 第48页 |
·决策树(Decision Tree) | 第48-49页 |
·最大熵建模 | 第49-50页 |
·k最近邻分类 | 第50-51页 |
第三章 中文未登录词识别 | 第51-55页 |
·中文未登录词的特点 | 第51-52页 |
·基于规则的方法 | 第52页 |
·基于统计的方法 | 第52-53页 |
·规则与统计相结合的方法 | 第53页 |
·解决方案 | 第53-55页 |
第四章 典型的中文未登录词识别 | 第55-61页 |
·中国人名识别 | 第55-56页 |
·中国地名识别 | 第56-57页 |
·中国组织机构名识别 | 第57-58页 |
·外国译名的识别 | 第58-59页 |
·部分识别系统介绍 | 第59-61页 |
第五章 评价机制 | 第61-65页 |
·评价标准 | 第61-64页 |
·测试集和测试方法 | 第64-65页 |
第六章 总结与展望 | 第65-67页 |
·总结 | 第65页 |
·展望 | 第65-67页 |
参考文献 | 第67-70页 |
3、Research of Chinese Person Names Recognition Based on Statistics and Rules | 第70-108页 |
Abstract | 第71-75页 |
Chapter 1 Preface | 第75-84页 |
·Research background and research meaning | 第75-77页 |
·Research object | 第77页 |
·Difficulty in Chinese name recognition | 第77-78页 |
·Domestic and international research history and current situation | 第78-81页 |
·Main work of the thesis | 第81-82页 |
·Structure of the thesis | 第82-84页 |
Chapter 2 Data base of knowledge and preliminary preparation | 第84-90页 |
·Feature of the Chinese name | 第84-85页 |
·Chinese participle software | 第85-86页 |
·Surname resource base | 第86-87页 |
·Knowledge base of choice words of name | 第87-88页 |
·Other resources | 第88-90页 |
Chapter 3 Extraction of candidate name | 第90-97页 |
·Zipf rule | 第90-91页 |
·The application of Zipf rule in the thesis | 第91-94页 |
·The extraction method of candidate name | 第94-95页 |
·Smooth mechanism | 第95-97页 |
Chapter 4 Feature extracting and apply with the rules | 第97-103页 |
·Inside feature | 第97-98页 |
·External feature | 第98-100页 |
·Recognition rule | 第100-103页 |
Chapter 5 System model and experiment result analysis | 第103-106页 |
·System model | 第103页 |
·Experiment result | 第103-104页 |
·Experimental result analysis | 第104-106页 |
Chapter 6 Summary and the prospect | 第106-108页 |
4、Research of Chinese Unlisted Words Recognition:A Survey | 第108-146页 |
Chapter 1 Preface | 第110-117页 |
·Brief introduction of IE | 第110-111页 |
·Chinese participle | 第111-113页 |
·About the Chinese participle | 第111-112页 |
·Key problems of the Chinese participle | 第112-113页 |
·Definition of unlisted words | 第113-115页 |
·Difficulties of the unlisted words recognition | 第115-117页 |
Chapter 2 History and current situation of English NE recognition | 第117-122页 |
·Recognition history | 第117页 |
·Hidden Markov model(HMM) | 第117-118页 |
·Support Vector Machine(SVM) | 第118-119页 |
·Decision tree | 第119-120页 |
·Maximum entropy model | 第120-121页 |
·k nearest neighbor classification | 第121-122页 |
Chapter 3 Chinese unlisted words recognition | 第122-128页 |
·Characteristics of the Chinese unlisted words | 第122-123页 |
·Method base on rules | 第123-124页 |
·Method base on statistics | 第124-125页 |
·Method base on statistics and rules | 第125-126页 |
·Solution pattern | 第126-128页 |
Chapter 4 Typical Chinese unlisted words recognition | 第128-137页 |
·Chinese name recognition | 第128-130页 |
·Chinese place name recognition | 第130-132页 |
·Chinese organization name recognition | 第132-133页 |
·Foreign translated name recognition | 第133-134页 |
·Introduction of some recognition systems | 第134-137页 |
Chapter 5 Mechanism of evaluation | 第137-142页 |
·Evaluation criterion | 第137-141页 |
·Testing set and testing method | 第141-142页 |
Chapter 6 Summary and prospect | 第142-146页 |
·Summary | 第142-143页 |
·Prospect | 第143-146页 |
致谢 | 第146页 |