首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向垃圾信息过滤的主动多域学习文本分类方法研究

摘要第1-12页
Abstract第12-15页
第一章 绪论第15-39页
   ·研究背景第15-21页
     ·垃圾信息定义第15-18页
     ·垃圾信息发展态势第18-21页
   ·研究现状第21-32页
     ·基于协议过滤第21-24页
     ·基于内容过滤第24-30页
     ·性能评价第30-32页
   ·研究内容第32-36页
     ·科学问题与挑战第32-34页
     ·本文的研究工作第34-36页
   ·研究成果第36-38页
   ·论文结构第38-39页
第二章 信息文档统计特性第39-57页
   ·信息文档的正文特性第39-42页
     ·电子邮件和手机短信语料第39-40页
     ·正文文本长度特性第40-42页
     ·正文和Token 重复率特性第42页
   ·信息文档的多域结构特性第42-45页
     ·信息文档格式第42-44页
     ·域间文本特征分析第44-45页
   ·Token 频率分布的幂律特性第45-56页
     ·幂律第45-46页
     ·邮件文档和邮件域文档第46-51页
     ·短信文档和短信域文档第51-56页
   ·本章小结第56-57页
第三章 面向垃圾信息过滤的多域学习文本分类第57-81页
   ·问题描述与框架第57-62页
     ·形式化描述第57-60页
     ·多域学习框架第60-62页
   ·分割策略第62-65页
     ·自然域文档分割策略第62-63页
     ·特定属性域文档分割策略第63-65页
   ·组合策略第65-70页
     ·均权组合策略第65-66页
     ·支持向量模型权组合策略第66-68页
     ·域分类器历史性能权组合策略第68-69页
     ·域文档信息量权组合策略第69页
     ·复合权组合策略第69-70页
   ·实验结果第70-78页
     ·TREC07P 上的bogo 实验第70-73页
     ·TREC07P 上的tftS3F 实验第73-75页
     ·CSMS-P 上的bogo 实验第75-77页
     ·CSMS-P 上的tftS3F 实验第77-78页
   ·本章小结第78-81页
第四章 面向垃圾信息过滤的时空高效文本分类第81-107页
   ·基于Token 频率索引的文本分类算法第81-86页
     ·统计原理第81-83页
     ·Token 频率索引第83-84页
     ·算法描述第84-86页
   ·算法复杂度分析第86-90页
     ·时间复杂度第86-87页
     ·空间复杂度第87-90页
   ·基于多类别Token 频率索引的文本分类算法第90-97页
     ·Token 频率统计特性第91-93页
     ·多类别Token 频率索引第93-94页
     ·算法描述第94-97页
   ·实验结果第97-105页
     ·TREC07P 上的tfibtc 实验第97-101页
     ·CSMS-P 上的tfibtc 实验第101-103页
     ·TanCorp-12 上的mtfibtc 实验第103-105页
   ·本章小结第105-107页
第五章 面向垃圾信息过滤的主动学习文本分类第107-121页
   ·问题描述与框架第107-110页
     ·形式化描述第107-109页
     ·主动多域学习框架第109-110页
   ·主动学习策略第110-113页
     ·时序优先策略第110-111页
     ·先验区间策略第111页
     ·基于方差的非确定采样策略第111-113页
   ·实验结果第113-120页
     ·TREC07P 上的10,000 反馈tfibtc.cs5 实验第113-115页
     ·TREC07P 上的1,000 反馈tfibtc.cs5 实验第115-116页
     ·CSMS-P 上的10,000 反馈tfibtc.cs5 实验第116-118页
     ·CSMS-P 上的1,000 反馈tfibtc.cs5 实验第118-120页
   ·本章小结第120-121页
第六章 结束语第121-125页
   ·研究结论第121-123页
   ·工作展望第123-125页
致谢第125-126页
参考文献第126-136页
作者在学期间取得的学术成果第136-137页

论文共137页,点击 下载论文
上一篇:面向片上网络的高性能路由器关键技术研究
下一篇:掌纹掌脉及其融合识别技术研究