首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向在线社区的用户信息挖掘及应用研究

摘要第3-5页
ABSTRACT第5-7页
第1章 绪论第14-34页
    1.1 课题研究背景及意义第14-18页
    1.2 研究现状及分析第18-31页
        1.2.1 网页中用户信息的抽取第18-21页
        1.2.2 跨社区的用户链指第21-24页
        1.2.3 用户专业水平的估计第24-26页
        1.2.4 基于用户信息的众包任务难度估计第26-30页
        1.2.5 存在的问题第30-31页
    1.3 本文的研究内容及章节安排第31-34页
第2章 基于弱指导学习方法的UGC网页中的用户名抽取第34-49页
    2.1 引言第34-36页
    2.2 自动获取和标注大规模训练数据第36-42页
        2.2.1 获取UGC网页候选集合第36-38页
        2.2.2 自动标注训练数据第38-42页
    2.3 UGC网页中用户名抽取的模型和特征第42-44页
        2.3.1 用户名抽取的模型第42页
        2.3.2 用户名抽取的特征第42-44页
    2.4 实验第44-47页
        2.4.1 评价方法第44页
        2.4.2 自动生成的训练数据质量评价第44-45页
        2.4.3 与有指导方法的对比实验第45-46页
        2.4.4 基于论坛及产品评价数据的实验结果第46-47页
    2.5 本章小结第47-49页
第3章 基于无指导方法的跨社区的用户链指第49-70页
    3.1 引言第49-51页
    3.2 用户链指问题分析第51-56页
        3.2.1 问题定义第51-52页
        3.2.2 用户问卷调查第52-54页
        3.2.3 About.me数据分析第54-56页
    3.3 自动获取同名消歧问题的训练数据第56-59页
        3.3.1 用户名语言模型概率的估计第57页
        3.3.2 自动获取训练数据算法第57-59页
    3.4 同名消歧问题的模型和特征第59-62页
        3.4.1 同名消歧问题的特征第60-61页
        3.4.2 同名消歧问题的分类模型第61-62页
    3.5 实验第62-69页
        3.5.1 数据集第62-63页
        3.5.2 测试数据第63-64页
        3.5.3 评价方法第64页
        3.5.4 特征值的缺失第64-65页
        3.5.5 实验结果第65-67页
        3.5.6 社区图分析第67-69页
    3.6 本章小结第69-70页
第4章 基于竞赛模型的用户专业水平的估计第70-92页
    4.1 引言第70-72页
    4.2 用户间专业水平的成对比较第72-74页
    4.3 竞赛模型第74-78页
        4.3.1 竞赛模型相关研究第74页
        4.3.2 基于TrueSkill模型的用户专业水平估计第74-77页
        4.3.3 基于PKScore模型的用户专业水平估计第77-78页
    4.4 实验第78-91页
        4.4.1 数据集第78-79页
        4.4.2 评价方法第79-81页
        4.4.3 基准系统第81-83页
        4.4.4 实验结果第83-89页
        4.4.5 不同方法的鉴别力分析第89-91页
    4.5 本章小结第91-92页
第5章 基于用户信息的众包任务难度估计第92-109页
    5.1 引言第92-94页
    5.2 问题定义第94-95页
    5.3 基于用户专业水平度量的问题难度估计模型第95-102页
        5.3.1 基于用户专业水平度量的竞赛模型第95-98页
        5.3.2 竞赛模型的数据稀疏问题第98页
        5.3.3 问题文本描述分析第98-100页
        5.3.4 基于用户专业水平度量和问题文本描述的正则化PKScore模型第100-102页
    5.4 实验第102-106页
        5.4.1 实验数据第102-103页
        5.4.2 评测数据第103页
        5.4.3 评价方法第103-104页
        5.4.4 基准系统第104页
        5.4.5 实验结果第104-106页
    5.5 基于用户链指信息的跨社区问题难度估计第106-108页
    5.6 本章小结第108-109页
结论第109-111页
参考文献第111-124页
攻读博士学位期间发表的论文及其他成果第124-127页
致谢第127-129页
个人简历第129-130页

论文共130页,点击 下载论文
上一篇:体制转换模型下金融衍生品的定价研究
下一篇:miR196α基因多态性在原发性肝癌发生发展中的作用及机制研究