首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

Blog检索中的关键问题研究

摘要第1-5页
ABSTRACT第5-8页
第一章 绪论第8-14页
   ·研究背景及意义第8-9页
   ·网页分析技术的研究现状第9-11页
     ·网页分析第9-10页
     ·全站模板抽取第10页
     ·网页内容块抽取第10页
     ·基于视觉信息的信息抽取第10-11页
   ·文本情感分析技术的研究现状第11-13页
     ·主客观分类第11页
     ·词的极性分类第11-12页
     ·基于情感词标注的文本情感分析第12页
     ·基于机器学习的文本情感分析第12-13页
   ·本文的工作及内容安排第13-14页
第二章 基于网页分析的Blog文本抽取第14-28页
   ·引言第14-15页
   ·网页分析的相关技术概念第15-16页
     ·DOM第15页
     ·SAX第15-16页
     ·CSS第16页
   ·网页分析系统的主要任务第16-19页
     ·HTML标签去除第16-17页
     ·语种识别第17页
     ·Spam检测第17-18页
     ·正文抽取第18-19页
   ·HTML文本信息抽取算法研究第19-28页
     ·非英语文档过滤算法第19-20页
     ·HTML标签对齐算法第20-21页
     ·网页文本抽取算法第21-22页
     ·网页文档分割算法第22-24页
     ·Spam检测算法第24-25页
     ·Blog网页的正文抽取算法第25-28页
第三章 基于统计模型的文本情感分析第28-41页
   ·引言第28-29页
   ·基于统计模型的文本分类技术第29-30页
     ·文本的表示和向量空间模型第29-30页
     ·特征抽取第30页
     ·特征选择第30页
     ·权重计算第30页
   ·分类模型第30-33页
     ·朴素贝叶斯模型第31-32页
     ·最大熵模型第32-33页
   ·特征选择和权值计算第33-37页
     ·N-Gram第33-34页
     ·Unigram及其权重计算第34-36页
     ·词性第36页
     ·否定词第36-37页
     ·同义词扩展第37页
   ·实验第37-41页
     ·数据集与工具包第38页
     ·语言特征选择方法的对比第38-41页
第四章 Blog观点检索系统第41-50页
   ·引言第41页
   ·TREC Blog评测介绍第41-44页
     ·评测历史及发展现状第41-42页
     ·评测数据、任务与相关技术指标第42-44页
   ·Blog观点检索系统设计与评测第44-50页
     ·Bolg主题检索系统第44-49页
     ·基于情感分类的Blog观点检索系统第49-50页
第五章 总结与展望第50-52页
   ·工作总结第50页
   ·需要进一步解决的工作第50-52页
参考文献第52-63页
致谢第63-64页
攻读学位期间发表的学术论文第64页

论文共64页,点击 下载论文
上一篇:数字图像篡改盲检测算法研究
下一篇:基于有向图的工作流模型在绩效考核系统中的应用