基于工人反馈的协同众包团队形成问题研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:cqxiaoguai1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同众包是指需要多人共同合作完成复杂任务的众包。由于工人需要相互协作才能完成任务,因此工人之间的协同代价是影响团队合作效率和质量的重要因素。与以往团队形成问题中基于社会网络通信成本计算协同代价模型不同的是,本文基于工人对互相之间协同情况的反馈计算工人之间的协同代价。所以,本文首先基于工人反馈研究复杂任务被分解后的协同众包团队形成问题,然后在该研究的基础上,本文针对工人的不诚实性和工人的信誉因素对问题进行拓展研究并提出解决思路和求解算法。
  首先,本文研究基于工人反馈的任务分解协同众包团队形成问题。与以往针对整体任务的协同众包团队形成问题的工作不同,本文考虑了众包复杂任务被分解为多个子任务后团队内部新的协同模式,并构建以领导者为中心对子团队互联然后基于工人的反馈计算团队协同度的团队协同模型。为了在该协同模型下求解最优团队方案,本文设计一种基于回溯法的精确算法。为了适应大规模场景,本文还提出一种基于二分查找的贪心策略启发式算法。实验结果表明本文的算法能够在不同规模下有效提高团队的协同度。
  然后,本文提出基于反馈的协同众包诚实性团队形成机制设计问题。众包中自私的工人会抬高报价以追求更高利益。这种行为会导致任务成本过高,也损害其他工人和发布者的利益。为了激励工人诚实报价,通常需要以最低价格成本来选择工人,然而该方式无法兼顾工人的协同代价,而以往有关工人不诚实性的研究也通常会忽略工人的协同代价。本文则基于工人之间协同代价的反馈,对工人的协作能力进行评估,挑选出有资格做领导者的工人集合,然后根据技能边际贡献成本贪心选择符合协同度约束和技能约束的工人加入团队。本文理论证明了机制的可计算性,个体理性以及诚实性。仿真实验表明,与经典的VCG机制相比,本文提出的团队形成机制在运行时间上具有较大优势。
  最后,本文研究基于工人反馈并考虑工人信誉的协同众包团队形成问题。以往考虑工人协同代价的研究工作没有同时考虑工人信誉对团队的影响,而在为众包任务选择工人时可能会出现协同度高但信誉值较低的工人,这会可能会导致最终形成的团队出现恶意工人。为了能够综合考量两者对团队质量的影响,本文基于工人的反馈提出一种团队质量计算模型。根据所建模型,本文设计一种精确算法用于求解最优团队方案。另外,本文还提出一种启发式算法以适应大规模场景下众包任务实时分配的需求。最后的仿真实验表明这两种算法能够在不同的场景下有效提高团队的质量。
其他文献
肺癌是威胁人类健康的多发癌症,其病灶的表现形式肺结节,它是致死率最高的癌症之一,如果在癌症早期发现病灶并及时进行治疗将会大大降低死亡率。医学CT(Computed Tomography,CT)影像是肺癌诊断的主要模态,这些影像数据为医学工作者提供了大量的诊断信息来判断癌症的类型。但是由于人工阅片需要医务工作者具有较强的专业素养,并且诊断比较耗时,因此计算机辅助诊断(computer-aided d
学位
磁共振成像因其具有无创、较高的软组织对比度等特点,广泛用于脑科学研究和临床脑疾病诊断,脑部磁共振图像的分割可辅助医生诊断病情。纵向弛豫时间T1是磁共振成像组织的固有属性,组织特性T1映射图不仅反映了成像组织的生理学或病理生理学特征,还提供了原始脑部磁共振图像不具有的组织特征。本文主要研究的是融合组织特性的脑部磁共振图像分割方法,研究内容如下:  (1)基于自旋回波—反转恢复序列以及反转时间,计算并
在光伏功率预测分析的过程中,由于光伏板受外界因素影响,输出功率会产生变动,从而威胁到电网的安全。本文针对光伏功率影响因素和算法的创新应用展开研究。实验主要完成以下工作以及研究:  (1)SVM算法是本实验运用机器学习预测光伏输出功率中所选择的经典算法。研究使用GBDT算法和SVM算法组合的方式对光伏功率输出进行短期预测。由于得到的电站数据包含多组因素,使用GBDT算法对数据中的因素进行重要性分析,
学位
步态特征是一种新型的生物特征,与其它的生物特征,如人脸、指纹等相比,其最突出的优势在于非接触性和远距离适用性。在当今高科技越来越发达的时代,步态识别在智能视频监控和身份识别领域都有着重要的实用价值。在传统步态识别方法中,因为步态模型的参数通常是根据人的先知经验选取的,识别率的高低受步态建模的影响较大,另一方面,外界因素如大衣外套、背包携带物等对模型的训练也会产生较大的影响。针对以上问题,本文分别开
学位
深度神经网络的训练任务通常具备计算和存储密集的特性,往往需要依赖于 GPU集群中大量 GPU 计算以及显存资源,并通过分布式训练以提升训练效率。传统分布式训练中数据并行的方式因参数同步存在巨大通信开销,而模型并行则由于计算依赖性导致 GPU 利用率较低,均影响了分布式训练的效率。为此,最新的流水线分布式训练在模型并行基础上,通过分时注入训练数据的方式显著增加 GPU 利用率。然而,在现有的GPU集
学位
随着数据共享的不断深入,对描述数据产生与演化原理的世系工作流(Provenance Workflow)进行共享发布的需求日益迫切,世系工作流在追踪历史信息、数据恢复、数据来源引用等方面有重要应用价值,直接对世系工作流进行共享发布存在泄露工作流隐私风险,世系工作流共享发布中的隐私保护问题已成为研究者关注的热点。针对现有世系工作流模块隐私与结构隐私保护方法存在的不足,提出维持溯源查询可用的隐私保护世系
学位
我国的心血管疾病死亡率居各病因之首,占居民疾病死亡构成的40%以上,心律失常是心血管疾病中重要的一组疾病,标准的12导联心电信号是诊断心律失常的重要工具,基于心电信号的心律失常自动检测对预防和治疗心血管疾病有重要意义。虽然12导联心电图信号比单导联心电图提供了更全面的心律失常信息,然而不同导联之间的信息很难有效融合,因此,基于12导联心电开发一种具有较高准确性和较强泛化能力的的心律失常自动检测算法
学位
面向服务的架构(Service-Oriented Architecture,缩写SOA)由于其应用程序接口独立、资源可共享和重用的特点得到广泛的利用,解决了传统应用架构应用程序难以管理、系统依赖特殊环境的问题。服务集成框架是适用于实时分布式应用领域的 SOA 实现方案,由于缺乏服务组合机制,系统中大量已有可用服务难以被有效复用。而现有的服务组合机制难以直接应用在同时支持发布订阅和请求应答两种通信方
随着X射线计算机断层成像(X-ray Computed Tomography,CT)在现代医学中的应用越来越广泛,CT 检查中潜在的辐射风险也引起了广泛的关注,过量的辐射容易诱发白血病以及癌症等疾病,因此,降低CT扫描过程中的辐射剂量刻不容缓。但是降低CT扫描过程中的辐射剂量会导致重建后的CT 图像中的信噪比降低,CT 图像中存在着严重的噪声和伪影,进而影响医生的诊断。为了提高在低扫描剂量下CT图
当今,网络数据作为一种广泛使用的数据载体,正逐渐成为人们认知并抽象世界的一种方式之一。网络中除了节点和边的信息外,往往还包括丰富的节点属性,蕴含巨大的价值。网络表示学习,是一种旨在将网络数据中的节点表示成低维、稠密且是实值向量表示形式的新颖的表示学习方法,学习到的向量表示将会用于各类下游任务如节点分类和链路预测中以提升性能。然而现有的深度网络表示学习方法由于忽略了嵌入表示的分布容易陷入过拟合问题,