首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Web舆情的话题识别与追踪技术研究

中文摘要第1-4页
Abstract第4-8页
第一章 绪论第8-24页
   ·课题研究的背景和意义第8-10页
   ·网络舆情监控系统架构第10-11页
   ·话题识别与追踪第11-15页
     ·TDT概述第11-12页
     ·TDT的相关概念第12-13页
     ·TDT子任务第13-15页
   ·国内外研究现状第15-21页
     ·话题表示模型研究第16-17页
     ·话题检测算法研究第17-18页
     ·话题追踪算法研究第18-21页
   ·本文的研究内容第21-22页
   ·本文的内容组织第22-24页
第二章 信息采集与预处理第24-35页
   ·网页采集第24-29页
     ·通用爬虫第24-25页
     ·聚焦爬虫第25-27页
     ·通用爬虫与聚焦爬虫的工作流程图第27页
     ·网络爬虫的爬行策略第27-28页
     ·WebSpider蓝蜘蛛采集系统第28-29页
   ·Web信息抽取第29-31页
     ·Web信息抽取的概念第29页
     ·Web信息抽取的方法第29-30页
     ·HtmlParser第30-31页
   ·中文文本分词第31-34页
     ·文本分词方法第31-33页
     ·停用词过滤第33页
     ·ICTCLAS中文分词系统第33-34页
   ·本章小结第34-35页
第三章 话题识别技术第35-75页
   ·话题表示模型第36-42页
     ·布尔模型第36页
     ·向量空间模型第36-39页
     ·概率模型第39-40页
     ·统计语言模型第40-41页
     ·隐式语义索引第41-42页
   ·新闻报道的特点第42-45页
     ·结构特征第42-44页
     ·时间特征第44-45页
   ·多策略改进的话题识别模型(TD-VSM)第45-48页
     ·改进的ADV-TF-IDF第45-47页
     ·改进的COS余弦夹角相似度第47-48页
   ·话题识别算法第48-57页
     ·基于划分的方法第49-50页
     ·基于层次的方法第50-51页
     ·基于密度的方法第51-52页
     ·基于网格的方法第52页
     ·基于模型的方法第52页
     ·基于自组织映射的方法第52-53页
     ·传统的话题识别算法(Single-Pass)第53-57页
   ·多策略改进的话题识别算法(MSTLC)第57-74页
     ·两层聚类架构(Tow Layers Clustering Architecture)第57页
     ·第一层聚类算法(DBS-BIC-K-Means)第57-67页
     ·第二层聚类算法(Multi-Centriod-Single-Pass)第67-72页
     ·MSTLC算法架构图第72-73页
     ·MSTLC算法流程图第73-74页
   ·本章小结第74-75页
第四章 话题追踪技术第75-107页
   ·多策略改进的话题追踪模型(TT-VSM)第76-78页
     ·TF-IDF的改进第76-78页
     ·基于时间衰减的改进第78页
   ·话题追踪算法第78-92页
     ·Rocchio算法第78-79页
     ·决策树第79-80页
     ·朴素贝叶斯第80-81页
     ·神经网络第81-82页
     ·Adaboost第82-83页
     ·K近邻法(KNN)第83-85页
     ·支持向量机(SVM)第85-92页
   ·改进的话题追踪算法(I-B-SVM-KNN)第92-106页
     ·选择SVM算法的原因第92页
     ·解决边界分类精度问题(SVM-KNN)第92-95页
     ·解决样本不平衡问题(BLAN-SVM-KNN)第95-97页
     ·解决增量学习问题(INCREMENTAL-BLAN-SVM-KNN)第97-105页
     ·I-B-SVM-KNN算法架构图第105-106页
   ·本章小结第106-107页
第五章 实验结果与分析第107-127页
   ·实验评估第107-108页
   ·实验数据第108-109页
   ·实验环境第109-110页
   ·话题识别实验第110-118页
     ·实验设计第110-111页
     ·实验结果第111-115页
     ·实验分析第115-118页
   ·话题追踪实验第118-126页
     ·实验设计第118-121页
     ·实验结果第121-124页
     ·实验分析第124-126页
   ·本章小结第126-127页
总结与展望第127-129页
参考文献第129-138页
个人简历、在学期间发表论文情况第138-139页
致谢第139页

论文共139页,点击 下载论文
上一篇:电磁式电器三维测试系统设计及三维动态特性研究
下一篇:面向移动轨迹发布的隐私保护技术研究