首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

维吾尔语新闻话题识别技术研究

摘要第1-4页
Abstract第4-7页
第一章 引言第7-10页
   ·本文研究的背景及意义第7页
   ·本文的主要工作第7-8页
   ·本文的论文组织第8-10页
第二章 话题识别与跟踪技术第10-18页
   ·国内外综述第10-12页
   ·话题识别与跟踪第12-17页
     ·话题识别相关术语第12-13页
     ·研究任务及主要技术第13页
     ·新闻数据流切分第13-14页
     ·新事件识别第14页
     ·报道关系识别第14页
     ·话题识别第14-15页
     ·话题跟踪第15页
     ·话题识别与跟踪的研究历史第15-16页
     ·系统评价第16-17页
   ·本章小结第17-18页
第三章 维吾尔语新闻话题识别技术第18-35页
   ·现代维吾尔语第18页
   ·现代维吾尔语的特点第18-19页
   ·维吾尔语新闻话题识别第19页
   ·维吾尔语新闻话题识别流程第19-20页
   ·新闻文本分析及预处理第20-21页
     ·停用词处理第20-21页
     ·新闻文本词性标注第21页
   ·新闻报道的表示第21-27页
     ·向量空间模型第22-24页
       ·TFIDF 权重第22-23页
       ·权重公式的改进第23-24页
     ·后缀树文本模型第24-26页
     ·文本的相似度计算第26-27页
       ·余弦相似度第27页
     ·新闻类簇的相似度计算第27页
   ·维吾尔语的新闻要素第27-31页
     ·新闻报道的时间第29-30页
     ·新闻报道时间窗口第30-31页
   ·新闻文本特征降维第31-32页
     ·新闻特征选择第31-32页
   ·实验数据第32-34页
   ·本章小结第34-35页
第四章 新闻话题识别算法第35-57页
   ·Single Pass 聚类算法第35-36页
   ·平均分组聚类算法第36页
   ·KMeans 算法第36-37页
   ·后缀树聚类算法第37-39页
   ·改进的维吾尔语后缀树聚类算法第39-43页
     ·改进的维吾尔语新闻话题识别流程第39-40页
     ·算法描述第40-41页
     ·短语类簇第41页
     ·聚类阈值调整第41页
     ·合并基本类簇第41-42页
     ·相似度公式改进第42页
     ·聚类标签识别第42-43页
   ·两种后缀树聚类算法性能比较第43-46页
   ·近邻传播算法第46-52页
     ·参数调整第48页
     ·相似度测量第48-49页
     ·半监督聚类第49页
     ·AP 算法速度改进第49-50页
     ·聚类算法的综合第50-51页
     ·AP 算法的应用第51-52页
     ·数据集的特征方面改进第52页
     ·AP 算法时间复杂度分析第52页
   ·维吾尔语话题识别原型系统第52-54页
   ·实验结果与分析第54-56页
   ·本章小结第56-57页
第五章 总结和展望第57-59页
   ·本文的主要工作第57页
   ·展望第57-59页
参考文献第59-65页
在读研究生期间发表的论文第65-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:新疆维吾尔族手工地毯图案矢量化技术研究
下一篇:人口信息统计系统的设计与实现