首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于互信息的网页信息过滤技术的研究与应用

摘要第1-4页
Abstract第4-6页
目录第6-8页
第1章 引言第8-13页
   ·选题背景及意义第8-9页
   ·国内外研究现状第9-11页
   ·本文的主要研究内容与组织结构第11-13页
     ·主要研究内容第11页
     ·组织结构第11-13页
第2章 网页信息过滤的相关理论与技术第13-24页
   ·中文分词技术第13-15页
     ·常用的中文分词算法第13-14页
     ·中文分词技术中存在的问题第14-15页
   ·文本表示技术第15-17页
     ·布尔模型第15页
     ·向量空间模型第15-16页
     ·概念表示模型第16-17页
   ·文本特征提取技术第17-19页
     ·文本特征提取的基本思想第17页
     ·常用的文本特征提取模型第17-19页
   ·信息过滤第19-22页
     ·布尔模型第20页
     ·向量空间模型第20-21页
     ·潜在语义索引模型第21-22页
     ·Rough 集理论模型第22页
   ·信息过滤的评价标准第22-24页
第3章 训练语料库的构建第24-35页
   ·语料库构建的理论基础及相关技术第24-26页
     ·语料采集第24-25页
     ·语料加工第25-26页
     ·语料管理第26页
   ·语料库建设中存在的问题第26-29页
     ·设计问题第26-28页
     ·标准规范问题第28页
     ·产权保护问题第28-29页
   ·非法信息语料库的构建第29-35页
     ·网页内容结构分析第29-30页
     ·网页内容提取第30-31页
     ·实验与结果分析第31-32页
     ·非法语料库的构建第32-35页
第4章 互信息过滤算法的设计第35-44页
   ·文本预处理第35-38页
     ·分词处理第36-37页
     ·文本表示第37页
     ·特征提取第37-38页
   ·互信息过滤算法设计第38-41页
     ·理论依据与工作原理第38-39页
     ·互信息过滤算法第39-40页
     ·阈值(Threshold)的确定第40-41页
   ·特征向量的动态更新第41-44页
第5章 过滤系统的设计与实现第44-52页
   ·系统的设计思想第44页
   ·系统的总体架构设计第44-46页
   ·实验及结果分析第46-52页
     ·系统的开发环境第46页
     ·实验及结果分析第46-50页
     ·与其它模型的比较第50-52页
第6章 结论第52-53页
参考文献第53-57页
攻读硕士学位期间发表论文第57-58页
致谢第58-59页

论文共59页,点击 下载论文
上一篇:基于笔交互的农产品信息采集与发布系统的设计与实现
下一篇:RFID防碰撞算法研究