首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于文本分类的话题跟踪及其一元语法模型的应用

摘要第1-4页
ABSTRACT第4-5页
目录第5-7页
1 引言第7-14页
   ·课题的提出第7页
   ·几个基本概念第7-8页
   ·TDT的历史研究第8-9页
   ·TDT研究任务以及主要技术第9-13页
     ·新闻报道切分第10页
     ·新事件识别第10-11页
     ·报道关系识别第11-12页
     ·话题识别第12页
     ·话题跟踪第12-13页
   ·论文各部分的主要内容第13-14页
2 文本分类第14-28页
   ·问题描述第15-16页
   ·特征选择第16-18页
   ·权重的计算第18-19页
   ·分类算法第19-24页
     ·简单向量距离分类法第20页
     ·Rocchio算法第20-21页
     ·贝叶斯算法第21页
     ·K最近邻居算法第21-22页
     ·支持向量机算法第22-23页
     ·其他分类算法第23-24页
   ·阈值的确定第24-25页
   ·评估方法第25-26页
   ·分类算法的实验比较第26-28页
3 话题跟踪第28-46页
   ·相关研究第29-32页
     ·马萨诸塞大学的方法第29-30页
     ·BBN公司的方法第30页
     ·卡内基梅隆大学的方法第30-32页
   ·话题跟踪的策略第32-36页
     ·KNN与SVM并行结合第33-34页
     ·KNN与SVM串行结合第34-36页
   ·实验与结果讨论第36-44页
     ·数据来源第36-37页
     ·评价方法第37-38页
     ·结果分析第38-44页
       ·K最近邻居算法的实验第39页
       ·支持向量机算法的实验第39-41页
       ·KNN与SVM并行结合的实验第41-42页
       ·KNN与SVM串行结合的实验第42-44页
   ·小结第44-46页
4 基于一元语法模型的话题跟踪第46-55页
   ·一元语法模型第46-48页
   ·基于一元语法模型的构造过程第48-50页
   ·影响话题跟踪性能的几个因素第50-51页
   ·实验及结果分析第51-54页
     ·测试语料及评测方法第51页
     ·实验结果第51-54页
       ·平滑参数选取第51-52页
       ·特征数目对话题跟踪性能的影响第52-53页
       ·分词技术对话题跟踪性能的影响第53-54页
       ·报道长度对话题跟踪性能的影响第54页
   ·小结第54-55页
5 总结第55-56页
   ·全文小结第55页
   ·进一步研究的展望第55-56页
致谢第56-57页
参考文献第57-59页

论文共59页,点击 下载论文
上一篇:美国梦的破灭--再读菲茨杰拉德的《了不起的盖茨比》
下一篇:大学EFL课堂环境下的协商性互动与学生输出