WEB文本挖掘中关键问题的研究

摘要	第1-7页
ABSTRACT	第7-10页
目录	第10-13页
第一章绪论	第13-33页
·课题的研究背景和意义	第13-15页
·文本挖掘相关技术概述及研究现状	第15-21页
·文本分类概述及研究现状	第15-17页
·文本聚类概述及研究现状	第17-18页
·信息抽取概述及研究现状	第18-20页
·文本检索概述及研究现状	第20-21页
·文本挖掘领域亟待解决的问题	第21-23页
·本文的工作	第23-27页
参考文献	第27-33页
第二章基于统计语言模型的短文本计算	第33-51页
·引言	第33页
·文本信息处理基础知识	第33-37页
·文本的表示	第34-36页
·特征选择	第36-37页
·基于N-gram的特征提取和 RPCL的短文本聚类算法	第37-47页
·相关工作	第38页
·算法描述	第38-43页
·实验及分析	第43-47页
·小结	第47-48页
参考文献	第48-51页
第三章面向广告推荐和情感分析的WEB文本信息抽取	第51-77页
·引言	第51-52页
·信息抽取常用算法和模型	第52-57页
·N-gram语言模型	第52-53页
·隐马尔可夫模型	第53-54页
·最大熵模型	第54-57页
·基于隐马尔科夫模型的半监督中文复合词抽取算法	第57-65页
·相关工作	第58-59页
·算法描述	第59-63页
·实验及分析	第63-65页
·基于最大熵和LMR模板的中文情感词抽取算法	第65-72页
·相关工作	第65-66页
·算法描述	第66-67页
·实验及分析	第67-72页
·小结	第72-73页
参考文献	第73-77页
第四章基于监督和半监督的文本情感分类	第77-109页
·引言	第77-78页
·常用的监督和半监督文本分类算法	第78-84页
·常用文本分类算法	第79-81页
·半监督文本分类算法	第81-84页
·文本情感分类的研究现状	第84-86页
·主客观分类	第84页
·情感极性分类	第84-86页
·基于带先验的最大熵歌词情感分类	第86-95页
·相关工作	第86-87页
·歌词语料集统计信息	第87-90页
·算法描述	第90-93页
·实验及分析	第93-95页
·基于图的半监督学习文本情感分类算法	第95-101页
·算法描述	第95-98页
·实验及分析	第98-101页
·小结	第101-102页
参考文献	第102-109页
第五章文本观点检索研究	第109-119页
·引言	第109页
·相关研究	第109-110页
·文本观点检索系统设计与评测	第110-116页
·COAE2008观点检索任务、数据及相关评测指标	第111-113页
·文本观点检索系统	第113-116页
·小结	第116-117页
参考文献	第117-119页
第六章总结与展望	第119-123页
·本文的工作总结	第119-121页
·未来的工作展望	第121-123页
致谢	第123-125页
攻读博士学位期间发表的论文	第125-126页