首页--文化、科学、教育、体育论文--信息与知识传播论文--信息与传播理论论文--信息资源及其管理论文

基于统计的文本分类技术研究

1 绪论第1-32页
   ·研究背景第14-15页
   ·应用领域第15-18页
     ·冗余过滤第16页
     ·组织管理第16-17页
     ·智能检索第17页
     ·信息过滤第17-18页
     ·其它应用第18页
   ·研究内容第18-22页
     ·理论分析第19页
     ·技术研究第19-20页
     ·实验与应用第20-22页
   ·研究现状第22-30页
     ·分类算法第23-24页
     ·典型分类系统第24-30页
   ·论文组织第30-32页
2 文本分类相关技术第32-54页
   ·文本检索与文本分类第32-34页
   ·自然语言处理第34-38页
     ·自动分词第35-37页
     ·N元模型第37-38页
   ·分类体系第38-41页
     ·等级列举式分类法第39页
     ·主题组织法第39页
     ·分面组配式分类法第39-40页
     ·存在的问题第40-41页
   ·模式识别算法第41-45页
     ·预处理第41-42页
     ·主要算法第42-45页
   ·文本分类系统第45-54页
     ·系统结构第47-48页
     ·分类系统评价第48-54页
3 文本特征选择第54-74页
   ·特征降维方法第54-57页
     ·文档频次方法第54页
     ·互信息方法第54-55页
     ·信息熵方法第55-56页
     ·x~2统计量方法第56-57页
   ·特征降维实验第57-64页
     ·降维实验第57-59页
     ·冗余文档检测实验第59-62页
     ·N元模型实验第62-64页
   ·案例分析:基于内容的信息推荐系统第64-74页
     ·整体架构第65-68页
     ·实现步骤第68-72页
     ·测试第72-74页
4 权重计算第74-96页
   ·常用权重计算公式第74-78页
     ·布尔权重第74-75页
     ·TFIDF型权重第75-78页
     ·基于熵概念的权重第78页
   ·权重函数测试第78-86页
     ·矛盾分析第79-81页
     ·特征项综合赋权方法第81-82页
     ·分类测试第82-86页
   ·案例分析:物理学科网站分类第86-96页
     ·物理文摘统计报表第89-90页
     ·网站数据统计报表第90-91页
     ·文摘与网站的比较第91-94页
     ·问题分析第94页
     ·加入网站数据分类测试第94-96页
5 分类器构建第96-116页
   ·常用算法分析第96-101页
     ·Rocchio算法第96-97页
     ·K近邻分类器第97-98页
     ·SVM分类器第98-101页
   ·分类算法测试第101-106页
     ·分类正确率比较第103-104页
     ·时间复杂度比较第104-106页
   ·案例分析:TREC2002文本过滤比赛第106-116页
     ·TREC文本检索会议第106页
     ·文本过滤的任务定义第106-107页
     ·文本过滤系统结构第107-111页
     ·测试结果及分析第111-113页
     ·系统特点第113-116页
6 结束语第116-118页
   ·研究工作第116-117页
     ·文本检索与文本分类第116页
     ·文本分类与分类体系第116页
     ·文本分类评价指标第116页
     ·文本分类算法研究第116-117页
     ·应用系统第117页
   ·下一步工作第117-118页
参考文献第118-126页
发表论著目录第126-127页
致谢第127-128页
作者简介第128页

论文共128页,点击 下载论文
上一篇:论我国沉默权制度之构建
下一篇:应用于低温冷害预报的东北玉米区域动力模型的研究