首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本内容分类和主题追踪关键技术研究

摘要第1-7页
ABSTRACT第7-13页
第一章 引言第13-29页
   ·研究背景第13-14页
   ·文本分类第14-17页
     ·文本分类的定义第14页
     ·文本分类研究现状第14-17页
   ·垃圾邮件过滤第17-20页
   ·主题追踪第20-26页
     ·基本概念第23-25页
     ·研究现状第25-26页
   ·本文研究内容第26-27页
   ·本文组织结构第27-29页
第二章 基于判别能力的特征选取方法第29-41页
   ·问题提出第29-30页
   ·解决思路第30-31页
   ·基于散度的特征选取第31-32页
   ·实验分析第32-40页
     ·分类器第32-33页
     ·常用特征选取方法第33-34页
     ·实验语料第34页
     ·评价指标第34-35页
     ·评价过程第35页
     ·实验结果第35-40页
   ·小结第40-41页
第三章 面向文本分类的混淆类判别技术第41-57页
   ·问题提出第41-42页
   ·混淆类识别技术第42-45页
     ·混淆类第42-44页
     ·基于分类错误分布的混淆类识别第44-45页
   ·混淆类判别技术第45-46页
   ·基于判别能力的特征选取第46页
   ·两个阶段的分类器设计第46-48页
   ·实验分析第48-55页
     ·实验语料第48页
     ·评价指标第48-49页
     ·实验结果第49-55页
   ·小结第55-57页
第四章 面向垃圾邮件过滤的内容分析技术第57-83页
   ·问题提出第57-59页
   ·初审/复审协作式垃圾邮件过滤第59-60页
   ·垃圾邮件特征的自动发现第60-66页
     ·邮件预处理第62-63页
     ·Ngram抽取及统计第63-64页
     ·N-gram过滤第64-65页
     ·垃圾邮件特征选择第65-66页
   ·基于两层内容分析的复审过滤第66-71页
     ·朴素贝叶斯分类器第67-69页
     ·最大熵分类器第69-71页
   ·反馈学习自适应处理第71-72页
     ·快速过滤模块的自适应第71-72页
     ·二级内容过滤模块的自适应第72页
   ·实验分析第72-82页
     ·邮件语料第72-73页
     ·评价方法第73-74页
     ·实验结果第74-82页
   ·小结第82-83页
第五章 面向中文主题追踪的反馈学习技术第83-109页
   ·问题提出第83-85页
     ·问题1:主题表示第83-84页
     ·问题2:主题漂移现象第84-85页
   ·基于一元语法模型的主题追踪模型第85-86页
   ·实验语料与评价机制第86-89页
     ·实验语料第86-89页
     ·评测机制第89页
   ·基于多向量模型的主题追踪第89-95页
     ·多向量模型第89-91页
     ·基于多向量模型的话题追踪第91-92页
     ·实验结果与分析第92-95页
     ·小结第95页
   ·基于TAB的主题追踪第95-101页
     ·自适应提升第95-97页
     ·提升方法的缺点第97页
     ·时间自适应提升模型第97-99页
     ·实验结果与分析第99-101页
   ·基于主动学习的自适应主题追踪第101-104页
     ·样本选择标准第102-103页
     ·新假设h_(ncw)的建立第103页
     ·打分归一化以及阂值设定第103-104页
   ·实验结果与分析第104-107页
     ·基于ATAL方法的主题追踪性能第104-107页
     ·打分归一化对主题追踪系统的影响第107页
   ·小结第107-109页
第六章 结论第109-111页
   ·本文的主要贡献与结论第109-110页
   ·进一步的工作第110-111页
参考文献第111-123页
致谢第123-125页
攻博期间发表的文章第125-127页
攻读博士学位期间科研获奖第127-129页
科研经历第129-131页
作者简介第131页

论文共131页,点击 下载论文
上一篇:基于机器学习的路面对象识别关键技术研究
下一篇:基于OCTPN和混合遗传算法的JSP多目标优化调度