首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web中文信息抽取技术研究及其在招聘信息系统中的应用

摘要第1-4页
ABSTRACT第4-7页
第一章 引言第7-10页
   ·研究背景第7-8页
   ·研究现状第8页
   ·本文的研究内容第8-9页
   ·本文的结构安排第9-10页
第二章 信息抽取技术第10-27页
   ·WEB信息抽取第10-15页
     ·Web信息抽取背景及其分类第10-13页
     ·Web信息抽取的任务第13-15页
   ·中文命名实体识别第15-20页
     ·命名实体识别的任务第15页
     ·中文命名实体识别的困难第15-18页
     ·前人的相关工作第18-20页
       ·基于规则的方法第18-19页
       ·基于统计的方法第19页
       ·统计与规则相结合的方法第19-20页
   ·语言模型第20-27页
     ·N元模型第21-23页
     ·基于类的语言模型第23-24页
     ·马尔可夫模型第24-25页
     ·隐马尔可夫模型第25-27页
第三章 WEB招聘信息抽取系统设计第27-51页
   ·系统目标和分析第27-29页
     ·系统目标第27页
     ·系统分析第27-29页
   ·SPIDER的构建第29-31页
     ·Spider的工作原理第29-30页
     ·Spider的实现第30-31页
   ·预处理第31-37页
     ·HTML/XML标签过滤第31-35页
     ·词性标注第35-37页
   ·机构名识别第37-41页
     ·机构名识别现状第37页
     ·机构名识别理论基础第37-39页
     ·知识库的获取第39-40页
     ·机构名识别第40-41页
   ·地名识别第41-45页
     ·中文地名识别的现状第41页
     ·中文地名的特点第41页
     ·中文地名识别模型第41-45页
       ·基本定义第41-43页
       ·识别资源第43页
       ·算法模型第43-45页
   ·联系方式识别第45-47页
   ·联系方式识别第47-49页
     ·电话号码的识别第47-48页
     ·E-mail的识别第48-49页
   ·关系抽取第49-51页
第四章 系统的实现与测试第51-58页
   ·系统的实现第51-53页
   ·系统的测试第53-58页
     ·Spider部分第53-54页
     ·Name Entity Recognition部分第54-58页
第五章 总结与展望第58-60页
   ·论文工作总结第58页
   ·展望第58-60页
参考文献第60-63页
硕士期间参加的课题与发表的文章第63-64页
致谢第64-65页
附录第65-70页
 附录一(汉语文本词性标注标记集)第65-67页
 附录二(部分公司名录)第67-68页
 附录三(部分机构名后缀)第68-69页
 附录四(部分职位名)第69-70页
 附录五(部分区号列表)第70页

论文共70页,点击 下载论文
上一篇:基于加工图理论的O相合金高温变形机理研究
下一篇:祅教祭司鸟神与千秋、万岁图像之比较研究