首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于文本挖掘的学者简历自动生成

摘要第1-5页
Abstract第5-10页
1 绪论第10-14页
   ·研究背景第10-11页
   ·相关研究进展第11-12页
   ·本文工作第12-13页
   ·本文结构第13-14页
2 相关技术介绍第14-19页
   ·PDF第14-16页
     ·PDF简介第14页
     ·PDF特点第14-15页
     ·PDF文档结构第15-16页
     ·PDFBox第16页
   ·元数据第16-17页
     ·元数据定义第16-17页
     ·元数据的功能第17页
   ·HTML文档第17-19页
3 基于字典匹配和支持向量机的中文科技论文元数据抽取第19-26页
   ·相关工作第19页
   ·论文元数据抽取问题分析第19-22页
     ·多分类支持向量机第21页
     ·建立知识字典第21页
     ·论文元数据特征函数第21-22页
     ·特征选择第22页
   ·元数据抽取流程第22-23页
   ·实验测评第23-24页
   ·小结第24-26页
4 基于双序列比对的动态Web信息元数据抽取第26-35页
   ·相关研究工作第26-27页
   ·双序列比对算法第27-28页
   ·动态Web网页第28-29页
   ·基于双序列比对算法的Web数据抽取第29-32页
     ·生成HTML标记树第29-31页
     ·HTML结构树重构第31-32页
   ·基于双序列比对的HTML数据抽取第32-33页
   ·实验第33-34页
   ·小结第34-35页
5 基于遗传聚类的同名区分第35-45页
   ·同名区分的相关研究第35-39页
     ·有监督的同名区分方法第35-36页
     ·半监督的同名区分方法第36-37页
     ·无监督的同名区分方法第37-38页
     ·基于社会关系网络的同名区分方法第38-39页
   ·基于词的引文相似度的计算第39-41页
     ·关键词抽取第39页
     ·相似度计算第39-40页
     ·相似词计算第40页
     ·引文相似度算法第40-41页
   ·遗传聚类算法第41-42页
     ·遗传算法那编码方式第41页
     ·适应度函数第41-42页
     ·迭代计算第42页
   ·实验第42-43页
   ·小结第43-45页
6 简历自动生成系统第45-53页
   ·系统总体设计第45-47页
   ·信息融合模块的设计第47-50页
     ·数据库设计第47-48页
     ·信息融合规则第48-50页
   ·简历自动生成与LinkScholar系统第50-51页
   ·小结第51-53页
结论第53-55页
参考文献第55-58页
攻读硕士学位期间发表学术论文情况第58-59页
致谢第59-60页

论文共60页,点击 下载论文
上一篇:C++静态代码检测语法树构建方法研究
下一篇:基于CUDA的图像数字水印技术的研究