首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

异构信息源的领域人物信息抽取研究

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-18页
   ·课题研究的背景和意义第10-12页
   ·国内外研究现状第12-16页
     ·文本分类技术第12-13页
     ·信息抽取技术第13-16页
   ·研究内容及论文结构安排第16-18页
第2章 包含领域人物信息的网页判别第18-33页
   ·引言第18-19页
   ·数据源的获取第19-22页
     ·通过主题爬虫获取数据源第19-21页
     ·通过网页分类获取数据源第21-22页
   ·网页分类相关技术介绍第22-25页
     ·向量空间模型第22-24页
     ·支持向量机第24-25页
   ·基于网页内容和网页结构的网页表示第25-26页
     ·基于网页内容的网页表示第25-26页
     ·基于网页结构的网页表示第26页
   ·特征选择第26-29页
     ·基于文档频率的特征选择第27页
     ·基于 SVM 训练权重的特征选择第27页
     ·基于特征项对类的贡献度的特征选择第27-29页
   ·实验及结果第29-32页
     ·评价指标第29-30页
     ·实验数据集第30页
     ·基于网页结构与网页内容的实验及结果第30-31页
     ·三种特征选择方法的实验及结果第31页
     ·特征选择前后的实验及结果第31-32页
   ·本章小结第32-33页
第3章 基于网页结构的人物信息网页的分类第33-43页
   ·引言第33页
   ·人物信息网页分类第33-38页
     ·多记录人物信息网页第34-35页
     ·单记录人物信息网页第35-37页
     ·人物信息网页分类统计第37-38页
   ·基于规则的方法识别多记录网页第38-39页
     ·基于标签密度识别多记录有格式网页第38页
     ·基于特征词识别多记录自由格式网页第38-39页
   ·基于网页结构识别单记录网页第39-41页
     ·网页预处理第39-40页
     ·网页表示第40-41页
   ·人物信息网页分类实验及结果第41-42页
   ·本章小结第42-43页
第4章 基于网页结构的人物信息抽取第43-56页
   ·引言第43页
   ·人物属性信息抽取过程第43-45页
   ·候选信息块的获取第45-46页
     ·基于主题与网页文本内容的相似度提取候选信息块第45-46页
     ·网页去噪第46页
   ·基于规则的抽取器设计第46-50页
     ·触发词库的建立第46-47页
     ·抽取规则库的建立第47-50页
   ·基于网页结构和规则的人物信息抽取第50-53页
     ·多记录有格式网页的抽取第50页
     ·多记录自由格式网页的抽取第50-51页
     ·单记录有格式网页的抽取第51页
     ·单记录自由格式网页的抽取第51-52页
     ·单记录半结构网页的抽取第52-53页
   ·实验及结果分析第53-55页
     ·评价指标第53页
     ·实验结果第53-54页
     ·错误分析第54-55页
   ·本章小结第55-56页
第5章 高校计算机人物志系统的设计与实现第56-65页
   ·引言第56页
   ·系统总体架构设计第56-59页
     ·数据处理与存储第56-57页
     ·教师人物志系统设计模块第57-59页
   ·数据来源第59-60页
   ·数据库设计第60-61页
   ·系统功能模块第61-64页
     ·检索功能第61-63页
     ·查询结果排序功能第63-64页
     ·用户交互接口第64页
     ·管理员操作模块第64页
   ·本章小结第64-65页
结论第65-67页
参考文献第67-71页
攻读学位期间发表的学术论文第71-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:统计机器翻译中层次短语翻译模型的研究与实现
下一篇:面向自然场景分类的稀疏编码研究与应用