首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

万维网上数据处理方法的研究

摘  要第1-4页
ABSTRACT第4-6页
目录第6-10页
第一章 引言第10-17页
   ·研究背景第10-12页
     ·问题的出现第10-11页
     ·解决的途径第11-12页
   ·研究内容第12-16页
     ·文本/网页分类第12-13页
     ·文本/网页摘要第13-15页
     ·文本聚类第15-16页
   ·论文组织第16-17页
第二章 网页分类中的问题第17-27页
   ·引言第18页
   ·特征抽取第18-20页
   ·特征选择第20页
   ·分类器第20-22页
     ·朴素贝叶斯分类算法第21-22页
     ·支持向量机分类算法第22页
   ·训练方法第22-24页
   ·性能指标第24页
   ·实验结果第24-27页
     ·实验数据第25页
     ·有关特征抽取的实验第25-26页
     ·有关分类器的实验第26-27页
第三章 特征选择算法NV第27-31页
   ·特征选择方法第27-29页
     ·信息增益 IG第27页
     ·统计CHI第27-28页
     ·归一化方差NV第28-29页
   ·实验第29-30页
     ·实验设置第29页
     ·实验结果第29-30页
   ·小结和下一步工作讨论第30-31页
第四章 IRC分类算法第31-50页
   ·引言第31-32页
   ·相关工作第32-34页
     ·Web上对象的分类第32-33页
     ·查询日志的分析第33-34页
   ·算法设计第34-40页
     ·问题定义第34-35页
     ·基于内容的分类第35-36页
     ·迭代增强分类算法(IRC)第36-40页
   ·实验第40-48页
     ·实验设置第41-44页
     ·性能分析第44-47页
     ·参数调整第47-48页
   ·小结和下一步工作讨论第48-50页
第五章 基于隐链接的网页分类第50-59页
   ·引言第50-51页
   ·“隐链接”的定义及应用第51-54页
     ·“隐链接”第51-52页
     ·CLN分类算法第52-53页
     ·通过链接进行特征抽取第53-54页
   ·实验第54-58页
     ·“链接关系”的统计第54-55页
     ·链接关系对CLN的影响第55-56页
     ·特征提取的方法对分类效果的影响第56-57页
     ·“链接关系”在网页特征抽取中对分类性能的影响第57-58页
   ·小结和下一步工作讨论第58-59页
第六章 分类中的其他问题第59-66页
   ·主页识别第59-63页
     ·引言第59页
     ·相关工作第59-60页
     ·问题定义第60-61页
     ·解决方案第61-63页
   ·查询词(Query)分类第63-64页
     ·引言第63-64页
     ·解决方案第64页
   ·本章小结和下一步工作讨论第64-66页
第七章 EMAIL聚类第66-83页
   ·引言第66-67页
   ·相关工作第67-68页
     ·文本挖掘中的语言特征第67-68页
     ·频繁集挖掘第68页
     ·“受限”的聚类第68页
   ·挖掘GSP第68-72页
     ·抽取语言特征第69-70页
     ·挖掘GSP第70-71页
     ·生成GSP组第71-72页
   ·基于GSP的“半指导”聚类第72-74页
     ·GSP组的选择第72页
     ·GSP-COPKM第72-73页
     ·GSP-DCEM第73-74页
   ·实验第74-82页
     ·数据集第74-75页
     ·评价标准第75-76页
     ·实验结果与分析第76-80页
     ·聚类命名第80-82页
   ·本章小结和下一步工作讨论第82-83页
第八章 网页摘要第83-113页
   ·引言第83-84页
   ·传统摘要方法第84-88页
     ·Luhn摘要方法第84-85页
     ·LSA摘要算法第85-86页
     ·有指导的(Supervised)摘要方法第86-88页
   ·Content Body摘要算法第88-90页
     ·网页的结构特征第88-89页
     ·FOM模型第89-90页
     ·CB摘要方法第90页
   ·基于亲和性排序的摘要算法第90-93页
     ·相关定义第91页
     ·构建亲和性图第91-92页
     ·计算信息量第92-93页
     ·生成摘要第93页
   ·用query log来做摘要第93-96页
     ·改进Luhn第94页
     ·改进LSA第94-95页
     ·改进Content Body第95-96页
   ·基于摘要的网页分类第96-105页
     ·背景第96-97页
     ·相关工作第97页
     ·摘要方法描述第97-99页
     ·实验结果与分析第99-105页
     ·小结第105页
   ·基于摘要的网页聚类第105-112页
     ·引言第105-106页
     ·实验设置第106-108页
     ·实验结果第108-111页
     ·小结第111-112页
   ·本章小结和下一步工作讨论第112-113页
第九章 系统设计与实现第113-119页
   ·系统背景第113页
   ·系统实现第113-119页
     ·分类模块第115-117页
     ·摘要模块第117-119页
第十章 总结第119-121页
   ·研究工作的总结第119-120页
   ·进一步工作的展望第120-121页
参考文献第121-131页
致    谢第131-132页
本人简历第132-134页

论文共134页,点击 下载论文
上一篇:英国《取消董事资格法案》中“不适格”之研究
下一篇:三元混合液混合单元的优选与研制