首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向行业搜索引擎的WEB文本挖掘技术研究

摘要第1-8页
Abstract第8-9页
第一章 绪论第9-12页
     ·本文研究的背景(现状)和意义第9-10页
       ·研究背景第9页
       ·国内外研究现状分析第9页
       ·研究意义第9-10页
     ·本论文的主要工作第10页
     ·本论文的主要内容第10-12页
       ·WEB数据挖掘概述第10页
       ·中文WEB文本挖掘关键技术介绍第10-11页
       ·面向人名搜索引擎的文本聚类研究第11-12页
第二章 Web数据挖掘第12-19页
     ·Web数据挖掘概述第12页
     ·Web挖掘方法及流程第12-13页
       ·查找资源第12页
       ·信息选择和预处理第12-13页
       ·模式发现第13页
       ·模式分析第13页
     ·Web挖掘分类及各自的研究现状及发展第13-19页
       ·Web内容挖掘第14页
       ·Web文本挖掘第14页
       ·Web多媒体挖掘第14-15页
       ·从资源查找(Information Retrieval)的观点挖掘非结构化文档第15页
       ·从数据库(Database)的观点挖掘非结构化文档:第15-16页
       ·Web结构挖掘第16-17页
       ·Web用法挖掘(Web usage Mining)第17-19页
第三章 中文WEB文本挖掘关键技术第19-37页
     ·WEB文本获取第19页
     ·WEB文本消噪第19-22页
     ·文本的表示第22-25页
       ·基于汉语的文本特征提取第23-24页
       ·切词第24-25页
       ·特征的选取第25页
     ·文本特征缩减(特征子集选取)第25-28页
     ·信息抽取第28-30页
       ·分词标注第28-29页
       ·命名实体识别第29页
       ·实体关系识别第29-30页
       ·共指识别第30页
     ·中文网页聚类分析介绍第30-37页
       ·中文网页聚类的一般过程第30-31页
       ·常用聚类算法第31-32页
       ·相似性度量第32-37页
第四章 面向人名聚类搜索引擎的WEB文本挖掘研究第37-48页
     ·面向人名的搜索引擎第37-38页
     ·中文人名搜索引擎的体系结构第38-40页
     ·中文人名搜索引擎的服务模型第40页
     ·面向人名聚类搜索引擎的WEB文本挖掘总体流程及实现第40-48页
       ·网页抓取器第41页
       ·文档分析器第41-44页
       ·基于信息抽取的聚类分析器(补偿式信息抽取的主题文本分类算法)第44-48页
第五章 实验结果与分析第48-54页
   ·实验原型系统的设计与搭建第48页
   ·实验数据测试与分析第48-54页
       ·网络文本抓取结果分析第48-49页
       ·文本消噪结果分析第49-50页
       ·文本特征提取及特征重构结果分析第50-51页
       ·文本信息提取结果分析第51-52页
       ·CIETC算法结果分析第52-54页
第六章 结论与未来工作第54-56页
     ·创新点第54页
     ·应用前景第54页
     ·有待解决的问题及未来工作第54-56页
参考文献第56-59页
在读期间研究成果第59-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:学校招贴画的文化批判
下一篇:技术变迁中的路径依赖研究