基于声誉的社会化推荐系统关键技术研究

来源 :经营管理者·中旬刊 | 被引量 : 0次 | 上传用户:qnwy2051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文在个性化推荐的基础上提出基于声誉的社会化推荐系统模型,具体分为“数据追踪”、“数据挖掘”、“声誉值计算”、“领域匹配”以及“信息推荐”5个部分,并从学科整合和心理认知两个维度对该类系统中声誉值计算的原理和方法进行了重点论述。本文提出的将声誉与社会化推荐系统结合的思想以及不同领域对声誉值获取的方式,可以为当前海量资源背景下的风险识别等工作提供一定的参考价值。
  关键词:社会化推荐 模型 声誉计算
  一、引言
  自古以来,人们普遍倾向于通过朋友或者周围邻居的推荐来获取信息,而这种基于社交关系的推荐方式即使在互联网背景下依然具有倾向性,唯一的变化是社交场景变得更加丰富而便捷,成为“朋友”的门槛却在逐渐降低。众多学者关注这种消费者的行为并将其应用于个性化推荐的发展中,用来完善个性化推荐系统的发展。一般将由于用户之间的接触而形成的个性化推荐称为社会化推荐,而早期的基于用户的个性化推荐也属于社会化推荐的一种,随着后期的个性化推荐的发展,有关研究表明,用户过去行为的相似性并没有社会影响力重要,而纯粹抽象的数学分析所获得的推荐比从朋友或者其他人中获得的价值少[1]。因而,社会化的推荐被用于推荐的情景在逐渐得到拓展。
  由于时代的发展以及用户个性和品味的不断变化,除了预测出用户偏好的产品类型或者范围外,对个性化推荐出现的更多的挑战在于帮助用户在用户偏好的领域中过滤可能存在的风险,并在其基础上推荐最优的产品,这一点在信息资源领域方面尤其重要。互联网缩短了用户与资源接触的时间和距离,因此在相同的时间范围内,用户可以了解更多的资源,并通过比较这些资源做出更好地选择。然而现实是随着场景的不断丰富,资源增多的同时,风险因素也在增多。如移动互联网的发展,带动了支付工具的研发和完善,线上线下支付场景的布局,使得用户日常生活中的风险防范机制应该得到加强。
  现实生活中,领域中的权威型的用户推荐的内容或者对象往往更有价值,但是面对巨大的资源,一个用户不可能甄别所有资源的质量。互联网环境下,尽管一个用户的力量是薄弱的,但是如果大多数用户都推荐同一个资源,该资源被认可的几率会更高,而这种推荐变得更加重要。这种思想最简单的应用就是运用大众的智慧来选出高“声誉”的资源,从而进行推荐。“声誉”概念即将每个与特定对象(如商品、知识等资源)有关的用户的观点聚集起来,在不同领域内甚至同一领域不同维度选出最受欢迎或者最有影响力的资源来给其他用户提供建议,其中确定资源是否受欢迎的指标会受到特定领域的用户群体的倾向性影响,所以为了全面的显示评价信息,一般会通过多维度的评价体系来衡量,如通过标签或者评分等。
  本文在社交场景不断丰富的背景下提出基于声誉的推荐系统来在众多可能存在风险的资源中进行内容推荐,探讨现阶段存在的关键的技术问题,希冀其得到充分的发展。现阶段所存在的问题主要存在于声誉值的构建和更新上。
  二、声誉的相关概念
  声誉源于信任,声誉的诞生与信任有不可分割的关系。从感知虚拟网络中的“信任”以后,基于底层信任(即识别用户之间的哪些行为可以被认定为两个用户之间的信任)的发展趋势就主要分为两个方向:声誉和狭义的信任。在个性化推荐发展领域中,狭义的信任被定义为个人偏好识别中具有用户倾向性的一种社交化的元素,如对他人表现出好感、不好的感觉或者没有感觉等,而声誉则随着网络用户不断发展的共享、交流的需求而得到不断的演化。
  声誉的定义可以追溯到广义的信任中。关于信任的定义和分类可以参考文献[2]和[3]等。等[2]将信任定义为一种依赖主观意见的依赖性信任和存在一定安全隐患但更多取决于决策者当时心境的决策性信任。等[3]论述了信任的起源及其发展过程,并认为信任是随着用户合作时间长短以及次数的变化而变化的概念,即将信任看成是一种交易后的心理反馈,如果前期合作愉快,后期合作的概率将会增加,这也与文献[4-6]的观点一致。等[7]较全面的考虑用户在产生信任时的目的、场景以及其他特殊情形,将信任划分五种类别:“提供信任”、“访问信任”、“委托信任”、“身份信任”和“基于上下文的信任”。相比信任的多元化的定义与分类,声誉在概念上趋于一致,一般认为是诸多观点集成的结果。等[2]将声誉定义为关于一个人或一种事物的身份的一般性的说法,例如基于所有社区成员对其他成员或者资源对象意见基础上的推荐是在依赖性感知下的信任的集体看法。本文认为声誉是在先前合作(或使用)的基础上由其他用户逐渐传播的对合作伙伴(或者资源对象)的声誉的一种动态的、集成的观点。其中具有声誉属性的对象可以是用户,也可以是资源如图书等实物或者网络言论等虚拟事物等。我们在社会化推荐过程中经常涉及到的评分、投票等表达态度的方法可以作为传递这种有效信息的载体。
  三、基于声誉的社会化推荐系统模型
  1.系统推荐框架。基于声誉的社会化推荐系统从过程上可以分为“数据追踪”、“数据挖掘”、“声誉值计算”、“领域匹配”以及“信息推荐”5个阶段。不同领域的研究者在推荐系统模型中对于声誉值的计算会结合不同的领域科学来进行研究。大数据环境下对于声誉数据的追踪、挖掘等都起到了良好的支撑作用。
  1.1数据追踪。本文提出的基于声誉的社会化推荐系统除传统的协同过滤推荐方法中的用户数据和内容数据以外,重点讨论与声誉相关的数据来源。声誉相关的数据一般从与目标用户有过直接或者间接关联的用户集合中收集而来。推荐系统追踪的用户数据主要分为(1)用户对资源反馈的数据:社交网站中用户的浏览、使用资源的相关信息作为用户的行为记录,并通过后期的数据分析和挖掘等工作获取有助于推荐的资源。(2)用户之间互动的数据:用户利用互联网进行会话的过程中會产生互动痕迹,这种痕迹记录用户之间的行为,从而可以转化为用户之间的合作印象的描述,一般将这种印象描述为信任程度。即在基于声誉的社会化推荐信息系统中,我们需要记录的数据往往是用户行为中可以描述“用户-资源”或者“用户-用户”之间信任的数据。   1.2数据挖掘。该阶段工作主要将用户的行为记录通过数据挖掘的工具和方法转化为用户的偏好数据库及其声誉数据库。早期协同过滤个性化推荐方法中依赖用户的评分计算用户与用户或者内容与内容之间的相似性从而构建相似性数据库,即通过用户的偏好数据建立相似性数据库。本文提出的基于声誉的社会化推荐系统除需要构建相似性数据库外,还需要通过用户之间的交互数据以及用户对资源的反馈数据获得用户或者资源在其他用户印象中的声誉,所以该部分通过数据挖掘来获得用户记录中的用户偏好数据以及用户基本的声誉数据是非常重要的一个环节。
  1.3声誉值计算。该阶段主要进行声誉值的计算,由于用户实时处于动态的反馈或者互动的过程,会引起声誉值的变化,所以声誉值如何进行更新需要进行重点研究。假设用表示层次的集合,则对应每层更新所组成的声誉值的集合,从而根据不同的算法构成一个完整的声誉值更新体系,其中表示第层对应的用户或者资源的声誉,上下层级之间的声誉值一般具有循环更迭的特征。声誉的更新方式可以从不同的学科角度来进行探索,如等 [8]从物理学的角度采用对网络拓扑结构重新布线的方法来有规律的更新网络中用户的连接,以此来更新用户的声誉值,而文献[9-14]等则从概率论的角度循着时间更新声誉值。
  1.4领域匹配。上一步骤中可以获得用户的偏好集合以及用户和资源的声誉集合。需要注意的是,资源的类别属性在不同的领域往往所属不同,因而关于用户和资源的声誉值,在不同的领域会有所差别,所以根据领域或者领域下的分支学科单元来研究用户或者资源在过去的表现中所形成的声誉值变得更有实际意义。因此将用户在不同领域的偏好特征与对应的用户声誉数据库进行匹配,而资源归为相应的领域类别下,才能将该领域下在声誉值上面有区别力的用户或者资源按照用户个性化的需求推荐给他人。
  1.5信息推荐。基于声誉的推荐系统的最后一个环节是推荐信息给用户,该接口的存在使得用户直接获取系统的推荐变成可能。
  2.系统推荐模型。通过上面的五个阶段的分析,基于声誉的社会化推荐系统模型可以通过图1来进行描述。
  图1 基于声誉的社会化推荐系统模型。
  (1)根据用户在系统中所留存下 来的行为记录追踪所需要的基本元数据;
  (2)构建用户的偏好数据以及构建用户和资源的基本的声誉基础数据,同时通过不断添加的数据来实时更新用户和资源的声誉数据;
  (3)将资源的声誉以及用户的偏好数据和声誉数据在领域属性下进行关联;
  (4)最后根据用户的实时行为通过推荐算法进行个性化的推荐,其中推荐的信息包含符合声誉要求的相似用户所偏好的信息,以及符合声誉要求的资源。
  本文提出的模型直接将可能存在安全隐患的用户或者资源排除在外,从而对于资源的安全风险问题提出了一定的解决方案思路。
  四、声誉值获取与更新方法
  声誉值的计算的方法可以融合不同的学科领域知识来构建,以下从学科整合和心理认知构建两个维度来阐述声誉值构建的方法。
  1.学科整合维度。
  1.1基础范式。由于声誉是集合多数人的观点而集成的对目标用户的印象,所以从数学的角度来分析,可以采用简单的方法如简单求和或者加权平均等方式来建模。然而,这种方法没有考虑声誉集成的具体的因素及其关系、结构等,此外用户所存在的社会环境和网络发展水平也成为影响人们判断的重要因素,因而这种方法在衡量声誉上并不准确,并且容易产生误导作用。
  1.2概率模型。对于信息的集成,除了采用简单平均或者加权平均的方式来进行整体估计外,进一步可利用复杂的数学模型或者统计模型根据特定的情景和不同因素之间的关联来代替均值计算方式。概率模型将概率的思想引入声誉的计算中,通过概率密度函数来计算声誉,后期通过组合新采集的声誉信息与先前获得的声誉分数来更新目标用户的声誉值。这种通过概率来更新声誉值的观点很好的捕捉了声誉随时间变化的特征。
  1.3模糊集定义。模糊集的思想充分考虑信息的不确定性,属于信息论的范畴。在描述声誉值的过程中,模糊集的范围大表明其他用户对某用户或者资源的声誉的不确定性较大,反之声誉值较高。
  1.4图模型。图模型从数学领域中的图论分支知识将声誉在用户心中随着时间变化更迭的过程用图的结构来描述,通过逐层级的值的传递来获得和更新声誉值,可以更加形象的描述声誉值的动态变化过程。
  1.5流动模型。流动模型将整个社区中不同代理的声誉的形成和变化比作系统内部总值恒定的流动,从物理动力学的角度来看待声誉值的变化。
  在上述分类中,关于概率论和模糊集的方法可以看作同一理论的不同的解释,除了对概念的描述不一致以外,原理本质上有相似性。而图模型和流动模型则是从不同的层面对声誉值的更新进行描述,图模型强调声誉值前后之间的关系,而流动模型更加关注动态的变化以及整体系统的稳定状态。此外,还有一些系统探索影响声誉形成的更多丰富属性的因素来构建声誉系统,使得模型更加的丰富灵活。但是无论采用什么领域的角度来阐述声誉系统,如何衡量用户对他人或者其它资源的声誉印象时的不确定性以及声誉值的更新这两个问题一直是声誉系统的核心关注点。
  2.心理认知构建维度。上述学科整合部分是从模型嵌入的角度来探讨声誉值的获取方式以及更新方式,另外一部分学者从用户的判断和认知的角度来研究底层声誉构建的方法。用户往往是将内心对目标用户的预期与现实中该用户的行为表现进行对比而得出对该用户的认知,因此可以从心理学甚至博弈的角度来获得用户的声誉值。而用户在与他人互动之前的心理预期成为识别声誉值的重要前提,本文将其分为用户甄别其他用户是否撒谎以及对目标用户设定的角色期望两个方面进行论述。
  2.1角色识别模型。该模型是指用户通过在与其他用户接触的过程中甄别其他用户是否为撒谎者来排除撒谎者用户,从而避免信任风险,因此本文将其描述成角色识别模型。由于用戶本身可能并不清楚其他用户或者资源是否值得信任,所以可以通过用户的反应行为来捕捉其对他人的信任态度,如利用用户认为其他用户是否是撒谎者所表现出的积极或消极的态度的次数来判断声誉值。这种基于统计学的方法来捕捉用户的信任情况可以更好地消除判断上的不确定性。   2.2预期满意度模型。不同于撒谎者识别模型,这里将用户对他人的预期根据不同的场景设定为不同的角色,通过其他用户或者资源的表现与用户对这些角色的预期之间的差距来衡量用户对这些对象的信任水平。目标对象的声誉值根据其他用户对所有角色的期望满意度的加权集成来获得。加权集合的因素构成依赖于具体的社会背景。
  除上述讨论的几种因素外,不同的社会结构也会对声誉的构成产生一定的影响。
  学科整合和心理认知构建两个维度的方法均利用所搜集到的用户对其他用户或者资源的反馈元数据,通过建立的模型来构建目标对象的声誉值。而两者的主要区别在于前者主要从量化的角度来反映用户的态度,而后者重在追溯用户内心对于他人或者资源的反馈的源头。两者可以结合起来用于挖掘用户对其他用户或者资源的声誉值的构建。
  五、结语
  当网络社交已经成为人们日常生活的一部分时,如何识别网络用户的声誉成为一个避免信任危机以及风险识别的重要的前提。此外,随着用户需求的个性化的发展,简单的推荐已经不能满足个人的需求,所以个性化推荐的应用渗透到各个领域,成为接触用户的最后一个关口。本文设计了基于声誉的社会化推荐系统的模型,并就声誉值的计算模块从两个维度论述了以往的声誉系统中的声誉值的计算的原理和方法。然而,无论采用何种模型,声誉系统的研究焦点一般包含声誉的来源探究和声誉值的更新等。随着交叉学科知识的发展,相信未来关于基于声誉的推荐系统的研究会越来越丰富。
  参考文献:
  [1]Sinha R, Swearingen K. Comparing Recommendations Made by Online Systems and Friends [J]. In Proceedings of the DELOS-NSF Workshop on Personalization and Recommender Systems in Digital Libraries, 2001.
  [2] A, Ismail R, Boyd C. A survey of trust and reputation systems for online service provision [J]. Decision Support Systems, 2007, 43(2):618-644.
  [3]Mcnally K, O’Mahony M P, Smyth B. A comparative study of collaboration-based reputation models for social recommender systems [J]. User Modeling and User-Adapted Interaction, 2014, 24(3):219-260.
  [4]Mayer R C, Schoorman F D. An Integrative Model of Organizational Trust [J]. Academy of Management Review, 1995, 20(3):709-734.
  [5]Mcknight D H, Chervany N L. The Meanings of Trust. Technical Report MISRC Working Paper Series 96-04[J]. University of Minnesota Management Information Systems Research Center, 1996, 38(1):33-51.
  [6]Rousseau D M, Sitkin S B, Burt R S, et al. Not So Different After All: A Cross-Discipline View of Trust [J]. Academy of Management Review, 1998, 23(3):393-404.
  [7]Grandison T, Sloman M. A Survey of Trust in Internet Applications [J]. Communications Surveys &; Tutorials, IEEE, 2000, 3(4):2 - 16.
  [8]Cimini G, Medo M, Zhou T, et al. Heterogeneity, quality, and reputation in an adaptive recommendation model [J]. The European Physical Journal B - Condensed Matter and Complex Systems, 2010, 80(2):201-208.
  [9] A. Trust-Based Decision Making For Electronic Transactions [J]. Proceedings of the Fourth Nordic Workshop on Secure Computer Systems, 1999.
  [10] A, Ismail R. The beta reputation system[C]// Bled Conference on Electronic Commerce. 2002.
  [11]Mui L, Mohtashemi M, Cheewee A, et al. A probabilistic Rating Framework for Pervasive Computing Environments [J]. In Proceedings of the MIT Student Oxygen Workshop, 2001.
  [12]Mui L, Mohtashemi M, Halberstadt A. A computational model of trust and reputation [J]. In Proceedings of the 35th Hawaii International Conference on System Science, 2002:2431 - 2439.
  [13]Whitby A, A, Indulska J. Filtering Out Unfair Ratings in Bayesian Reputation Systems [J]. Third International Joint Conference on Autonomous Agenst Systems, 2004:106-117.
  [14]Dong P, Wang H, Zhang H. Probability-based trust management model for distributed e-commerce[C]// Network Infrastructure and Digital Content, 2009. IC-NIDC 2009. IEEE International Conference on. IEEE, 2009:419-423.
  作者簡介:周红(1988—)女。研究生。助教。
  ※基金项目:本文为湖北省科研指导性项目“资源多样性环境下具有风险识别功能的个性化推荐系统建设”(项目编号:B2017419),院教学研究项目“加强电子商务专业实践能力和创新能力的培养与实践”(项目编号:2016VYYBJY005)和院教学质量工程建设项目“电子商务战略性新兴(支柱)产业人才培养计划本科项目” (鄂教高(2014〕号文)的研究成果之一.
其他文献
摘 要:企业通过加强会计内部控制,不仅能够有效的提高会计信息的质量,而且对保护企业资产的安全和完整具有非常重要意义。企业通过实施会计内部控制,能够有效的规避风险,促进企业的可持续发展。近年来,我国企业会计内部控制工作取得了较好的成效,但也存在着一些风险,因此需要对这些风险进行有效防范,从而更好的提升企业的市场竞争力,为企业的健康、持续发展奠定良好的基础。  关键词:内部控制 风险 对策  一、引言
期刊
摘 要:建筑工程项目是一个体积庞大、工期较为长、费用较高的建设项目。为了规范建造工程项目及合理控制项目成本,需要对建筑工程的各个阶段进行工程计价。那么自2016年5月1日根据我国财政部、国税总局颁发的[2016]36号文中规定正式全面实行“营改增”计税方式,这一政策的实施对建筑工程项目的计价体系产生了非常大的影响。鉴于此,本文即阐述营改增后,建筑工程计价方式及计税方式的具体变化,并对此进行分析。 
期刊
摘 要:限购政策是否能有效抑制房价一直富有争议。本文将限购政策作为政策虚拟变量来构建固定效应面板模型,基于69个大中城市2009年1月至2017年3月的月度数据进行实证研究。结果发现:限购政策能有效抑制房地产价格上涨,区域性住房限购和非本市户籍居民家庭住房限购起到主要作用。  关键词:房地产调控 限购政策 房价  一、引言  自21世纪初期以来,房地产泡沫问题就开始困扰中国经济。一方面,住宅价格过
期刊
摘 要:本文根据中国外汇储备数据(1952-2017),结合全球化背景分析在目前的经济形势下首先分析外汇储备投资的现状,其次谈论外汇储备投资结构的优化方向,为中国的外汇储备管理投资提供发展建议,得出优化币种结构,完善相关风险管理机制,鼓励海外投资,发展主权财富基金的方式,以达到降低外汇储备管理风险,更好的促进内外平衡的目的。  关键词:外汇储备 成因 影响 建议 管理机制 投资发展  一、引言  
期刊
摘 要:随着经济全球化的趋势和我国经济的快速发展,在我国市场的经济体制下,企业之间的竞争越发激烈,在严峻的竞争市场中企业如何可持续的发展成为各企业思考的问题。在企业的管理过程中,财务会计对企业现有业务的开展和未來企业的发展具有重要的影响,企业在进行相应业务时,不可避免的与财务会计打交道,依据财务会计提供的信息做出相应的规划和调整。同时,财务会计信息也是反映企业经营成果的重要依据。本文主要就财务会计
期刊
摘 要:辽宁省推进农业的供给侧改革,农业发展的金融支持不足。商业银行、信用社等传统金融机构已经不能满足农业发展的金融需求,互联网金融由于其便利性渗透到广大的农村地区是农村金融发展的必然趋势。因此,在辽宁农村金融普惠制进程中要充分有效地利用互联网金融深化农村金融改革。  关键词:互联网金融 农村金融 普惠制  一、传统金融难以满足辽宁农村经济需求  2016年7月,辽宁出台了推进《关于推进农业供给侧
期刊
摘 要:新金融工具相关会计准则的实施将对银行业会计核算以及管理模式带来极大的影响。在此,分析了金融工具新旧会计准则的差异,针对福建农信,探讨了实施金融工具新会计准则对其影响,并阐述了应对金融工具新会计准则影响的具体措施,希望能够为福建农信执行新金融工具相关会计准则提供帮助。  关键词:金融工具 新会计准则 福建农信  一、金融工具新旧会计准则对比  1.分类方法比较。2017年3月31日,财政部修
期刊
摘 要:互联网时代的到来给社会上各大企业都提供了便利的条件,对我国的经济发展具有一定的促进作用。尤其是在企业会计方面,使得会计在记账、核算等方面都运用到了信息化技术。本文主要从“互联网+”对现代会计发展的影响做出了深刻的分析,旨在为我国现代会计的发展提供一些借鉴意义。  关键词:互联网 现代会计 会计信息  一、引言  随着互联网技术的不断发展,将互联网技术与会计工作相结合成为了每个企业会计部门的
期刊
摘 要:会计信息可以对外有效的展示企业的财务情况和运行现状,同时,企业的决策者可以据此进行企业的管理和重大决策。因此,企业的会计信息质量如何将事关企业的发展现状以及未来发展战略。对于从内部产生的会计信息而言,会计信息质量的高低取决于企业内部会计信息的传递,对会计信息的产生和传递过程进行严格的控制具有重要的意义。本文基于内部控制环境视角,对不同的内部控制环境对会计信息质量的影响进行深入的分析,并提出
期刊
摘 要:目前我国大陆地区分级诊疗试点工作取得部分成效,同时面临众多问题。通过对我国台湾地区分级诊疗新举措进行研究,为我国大陆地区更好推进分级诊疗,深化医药卫生体制改革,缓解“看病难问题”提供参考与借鉴。  关键词:台湾地区 分级诊疗 转诊  由于目前医疗卫生资源配置不平衡,导致出现民众诊疗流向不合理等问题,分级诊疗成为缓解“看病难”问题的重要举措。2017年5月5日,国务院办公厅发布《深化医药卫生
期刊