大数据的局限性

来源 :郑州轻工业学院学报(社会科学版) | 被引量 : 0次 | 上传用户:yuchenyk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要]大数据可以探知受众并把握其需求,帮助生产者进行适销对路的生产,并通过合适的媒体进行有效的广告传播,但大数据也有其局限性。(1)并非数据规模越大其价值越高,广告人不应盲目追求数据的“大规模”,而应根据自身业务需要采集合理规模的数据。(2)大数据的运用不具有解决问题的普适性,目前利用大数据技术针对网络平台进行广告信息精准推送可获得较高的数据回报率,而其他更多、更广泛的运用则需等到数据科学完善和成熟之后。(3)大数据的相对精准和广告的专业特性决定了完全根据大数据来做出广告决策是非常危险的,应通过数据收集手段,严谨记录、搜集和分析消费者各项数据与行为轨迹,同时还应运用社会心理学的方法,透过现象去体察消费者的内心世界。(4)大数据的价值不能过于高估,广告业既要以大数据为决策依据,又不能完全依赖大数据,现有大数据技术不能颠覆广告业的整个体系,更不能取代创意决策而成为广告业的核心。
  [关键词]大数据;广告业;受众碎片化;数据驱动
  [中图分类号]J524.3;F713.8[文献标志码]A[DOI]10.3969/j.issn.1009-3729.2015.01.019
  随着云时代的来临,大数据吸引了越来越多人的关注,成为当下被热炒的概念。大数据技术被各产业争相引入,逐渐被推向“神坛”。在广告业中,大数据可以推动目标市场数据化,提高广告的投放精准度,减小广告投放成本,获得业内广泛认同,并取得大量研究成果。与此同时,我们也应该正视其局限性并客观对待,唯有正确运用大数据才能使之更好地服务于广告业。本文拟从大数据等于高价值的误区、大数据采集的局限性、大数据精准的相对性及广告业中被高估的数据价值等方面进行梳理和分析,以期使人们正确地看待大数据对广告业的影响,使之更好地服务于广告业发展。
  一、大数据等于高价值是个误区
  被广为传播的大数据4V(Volume,Velocity,Variety,Value)理论[1],对广告业造成了冲击,广告业开始盲目追求数据的大规模,认为数据的规模越大其价值越高,中小数据没有被挖掘的价值。实际上,大数据是一个完整的生态系统,从其产生、采集、分类到聚集、挖掘、推送是一个完整的价值链,只有对每个环节进行多种技术处理,才能为不同产业提供有价值的服务。大数据的主要优点是以低成本满足企业对数据的需求,为企业提供数据回报。数据量规模的大小是相对而言的,同时也不是衡量数据价值的唯一标准,在实际调查研究中发现,数据规模与数据价值虽有一定的关联性,但两者之间难以用线性关系来表述[2]。大数据中含有大量数据噪声,数据价值利用率低,只有辨识并过滤掉大量重复信息,分类聚集、掌握一定“含金量”的数据,才能得出数据所蕴含的规律和本质,即数据中有意义的信息,显示出数据的真正价值。
  从社会发展角度来看,随着互联网和新媒介的不断发展,消费者的个性化需求不断增多,广告受众的“碎片化”[3]趋势日益显著。这种“碎片化”趋势迫使广告人更多地研究细分市场、小众媒介和个性消费。而大数据提供给广告人更多的是对“大趋势”的预测和判断,即使广告人能敏锐地侦测到某些小众趋势,但也往往容易被数据洪流所掩盖和摒弃。因此,广告人不应盲目追求数据的“大规模”,而应科学合理地抽样采集数据,以提高数据的利用率,降低数据采集的成本。应避免盲目追求“无意义”的大规模数据而加大资金投入,也避免过多无用数据对数据挖掘、分析的干扰。对于广告业来说,大数据固然重要,但对“小数据”“微数据”等细微数据信息也要引起足够重视,只有根据自身业务需要采集合理规模的数据,科学、合理、有效地利用数据资源,才能助力广告业的良性发展。
  二、大数据采集的局限性
  大数据时代,数据来源大致分为两类:一类来自于物理世界的科学实验数据或是传感数据;另一类来自于人类社会活动,主要是互联网。人类社会活动产生的数据主要包括:企业内部经营交易信息,物联网世界中商品、物流信息,互联网世界中人与人的交互信息、位置信息等。换句话说,我们在接触物联网、移动互联网、移动通讯、电子商务的同时,我们自身的数据也在不断地被收集,成为大数据中的数据资源。大数据技术使得捕捉和跟踪人群的生活习惯和消费行为变得更为容易,这也是广告业重视大数据技术及其应用的原因[4]。例如,电子商务网站和POS机可以获取账户的消费情况,从中了解个人的消费结构、品牌喜好、消费金额等有价值的信息;社交网络平台可以记录会员的身份资料、社交关系、成长经历、生活状态等个人信息;移动通讯可利用定位技术获取用户的地理位置、生活半径、目标人群聚集区等信息。除此之外,大数据可以跨领域、跨行业、跨平台、跨设备地对数据进行全面、综合的收集与分析。因此,运用大数据技术可以快速、精准地寻找到广告的目标受众,为目标人群精准推送产品信息,清晰描绘产品(品牌)的潜在消费人群的各种信息甚至是即时信息,掌握目标受众媒体接触习惯,从而客观、准确测评广告效果。以上种种是大数据应用在广告业中的理想化前景,但从目前大数据采集情况来看,大数据在广告业中的运用还存在很多盲区和不确定因素,主要体现在以下四个方面。
  一是以网络为主要来源的数据充斥着大量不完整或是虚假信息,数据多是随机动态产生的,具有多源异构、交互性、时效性、突发性等特点,非结构化数据多且即时性强[5]。例如,社交网站很难对会员注册的个人信息一一进行真实性的核查,电子商务网站无法控制一个交易账号只针对一个消费个体(一个淘宝账号全家共用),微信上发布的个人状态也随时都在更新等。
  二是数据收集渠道具有局限性,数据监控存在盲区。中国互联网络信息中心(CNNIC)发布的权威数据显示,截至2014年6月,我国网民数量达到6.32亿,手机网民数达到5.27亿[6]。可见,还有相当多的广告目标受众被排除在以互联网为主要数据来源的大数据之外。
  三是部分数据资源涉及商业机密和网络数据格式不统一,已成为实现大数据整合、共享的两大障碍,阻碍了大数据技术跨平台、跨设备、跨应用的全面采集与综合分析,降低了数据资源的应有价值。   四是数据采集过程和被采集的数据资源中会涉及个人隐私、商业机密和国家信息安全,因此,大数据的合法性问题将成为大数据运用的不确定因素之一。未来应制定长远可行的制约策略,增强数据主体对相关数据的控制力,通过立法来指导、规范、完善数据采集与应用行为。
  受以上因素的影响,大数据在广告业中的应用不具有解决问题的普适性,以其目前运用范围和带来的效果看,利用大数据技术针对网络平台进行广告信息精准推送可获得较高的数据回报率,如Google大力推广的实时竞价广告,而其他更多、更广泛的运用则需等到数据科学完善和成熟之后。
  三、大数据精准的相对性
  由于数据采集的局限性和数据分析的非客观性,大数据的准确性是相对的而非绝对的。美国学者Lisa Gitelman[7]认为,数据从来都不可能是“原始”的,数据总是依照某人的倾向和价值观念而被构建出来的。数据分析的结果看似客观公正,但其价值选择贯穿了从构建到解读的全过程。这说明数据分析的客观性是不存在的,无论是否运用智能分析系统(智能分析系统的数据模型都是人为构建的)。美国著名商业思想家纳西姆·尼古拉斯·塔勒布认为,随着数据量的增加,无意义的关联数据也越来越多,重要的数据信息可能被数据扩张带来的噪音所淹没,在真正解决问题时会将人引入歧途。可见,大数据也有短板,大量的数据噪声会干扰数据的精准分析,降低大数据的准确性。
  另外,随着信息时代的来临,消费者的生活方式、消费观念、消费行为和利益需求等逐步分化离散,这些“碎片化”的族群对广告信息、广告形式、传播媒介和媒体时段都有不同的偏好,这会导致数据量不断地激增,而从这些数据中挖掘、推导出的结论是否具有客观真实性还有待证明。例如,数据虽记录了不同地区的两个互不相识的家庭在某一段时间内购买了相同品牌、相同种类、相同数量、相同金额的消费品,但不能据此就认定这两个家庭属于同一类消费群体,具有同样的购买力和产品(品牌)喜好。因为这一结论的准确性取决于关联参数的设定和数据模型的客观性。所以,不能简单地认为准确的数据一定会推导出正确的结论。
  总之,数据的相对精准和广告的专业特性(广告面对的是个性化极强的“人”和复杂、多变的心理与行为)决定了完全根据大数据来做出广告决策是非常危险的。只有通过数据收集手段,严谨准确地记录、搜集和分析消费者的各项数据和行为轨迹,同时运用社会心理学的方法,透过现象去体察人的内心世界,才能使广告决策朝向正确的方向。
  四、广告业中被高估的数据价值
  受数据驱动思维的影响,广告业中大数据的价值往往被高估。这主要体现在以下三个方面。
  其一,片面强调广告的科学性而忽视其艺术性。从广告的学科属性来讲,广告属于科学与人文交叉的学科。广告是艺术的一种外在表现,以营销为目的、以传播为手段,既有科学的准确性、严谨性(理性),又有人文艺术的情感化、模糊化的属性(感性)。广告的科学性主要体现在运用数据技术了解市场、目标受众和消费需求,利用恰当的媒体渠道将特定信息推送给目标受众;广告的艺术性主要体现在运用各种视觉、听觉符号准确表述产品(品牌)信息,以引起受众的情感共鸣并使之产生消费欲望。科学性和艺术性作为广告的两个属性,互为补充、缺一不可。因此,片面地强调广告的科学性和数据的重要性,而忽视广告的创意表现与情感表达(即艺术性),是错误的。
  其二,强调数据的科学性、客观性而抹杀广告的属人性。从某种意义上来讲,大数据技术只是对传统调研方法的革新,它使数据的收集、分析更为全面、迅速、便捷、廉价。虽然数据资源的收集渠道和方式不同,但数据资源的价值都应体现在服务于广告创意和决策之上。而数据本身不具有价值,数据的真正价值是通过对数据进行合理的分析、判断,挖掘内在关键、有效信息而获得的。
  其三,偏信大数据是万能的。大数据虽然可以解读人脑无法理解的复杂情况,减少基于直觉、经验的判断,避免欲望对知觉造成的扭曲,但在广告业中依旧有很多问题是大数据所无法解决的。例如,大数据不能代替人的思考,不了解社会、文化背景对人的行为的影响,不能敏锐捕捉人的瞬间情感和情绪,不能分析人的思维过程。尤其是在现实中,很多消费行为具有无意识性和随机性,广告更多地是通过引发人的某种情感而实现促进销售目的的。因此,大数据只能作为广告决策的依据之一,而不能保证广告决策的正确性。
  五、结语
  大数据对广告业的科学化发展将起到关键的推动作用。作为广告业中一种先进、科学的手段,大数据可以探知受众并把握其需求,做出市场预判,帮助生产者进行适销对路的生产,并通过合适的媒体进行有效的广告传播,满足消费者的需求,实现生产与需求之间的适配。但大数据也有其局限性,对广告业来讲,不仅要关注、研究大数据技术及其应用,更要研究隐藏在大数据背后的社会学、心理学、经济学和传播学的机理,既要以大数据为决策依据,也不能完全依赖大数据。现有大数据技术不能颠覆广告业整个体系,更不能取代创意决策而成为广告业的核心。未来,随着大数据技术及其应用的不断发展与成熟,大数据的局限性会被更好地破解与弥补,广告业将在大数据中获得更多的数据回报。
  [参考文献]
  [1]
  邬贺铨.大智移云时代的产业变革[N].中国信息化周报,2014-04-21(05).
  [2]邬贺铨.大数据思维[J].科学与社会,2014(1):1.
  [3]黄升民,刘珊.大数据背景下营销体系的解构与重构[J].现代传播,2012(11):1.
  [4]张福平.自媒体情势下的艺术生长[J].郑州轻工业学院学报:社会科学版,2014(1):30.
  [5]李国杰,程学琪.大数据研究:未来科技及经济社会发展的重大战略领域[J].中国科学院院刊,2012(6):647.
  [6]凤凰新媒体.CNNIC:中国网民规模6.32亿手机网民比例首超PC[EB/OL].(2014-07-21)[2014-09-20].http://tech.ifeng.com/internee/detail_2014_07/21/37437832_o.shtml.
  [7]Lisa Gitelman.Raw Data is an Oxymoron[M].Cambridge:MIT Press,2013:126.
其他文献
[摘 要]数字阅读的兴起是当代信息传播业的一个重要现象,与以往的阅读方式相比,它在技术方面的优势很明显。但从人文视角来看,数字阅读会带来以下消极影响:一是影响深度思考。数字阅读,尤其是在线数字阅读虽能给人带来愉悦和感官刺激,但不利于人们深度思考。二是使人们更脆弱孤独。数字阅读在使社会网络联系密切的同时,也产生了很多的心理问题。在数字阅读时代,人们被碎屑无聊的信息包围,虽然人际交往越来越密切了,但是
期刊
[摘要]哥伦比亚作家加夫列尔·加西亚·马尔克斯的《百年孤独》与中国作家迟子建的《额尔古纳河右岸》在悲剧书写上有一定的共性。在女性视域下,《百年孤独》中的乌尔苏拉和《额尔古纳河右岸》中的“我”都是见证民族百年沧桑历史的百岁女性老人,且在故事中都起到了举足轻重的作用,都表现出了对本民族未来的担忧,希望用自己的力量为本民族做最后的坚守。在生态批评视域下,《百年孤独》和《额尔古纳河右岸》都涉及到了自然生态
期刊
[摘要]选取2004—2012年我国文化产品出口的面板数据,运用波士顿矩阵模型对我国文化产品竞争力进行实证分析发现,我国文化产品出口竞争力总体上较强,但不同类别的文化产品其竞争力有差异。其中,新媒体和视觉艺术是明星类产品,具有较高的市场竞争力和销售增长率;影视作品属于问题产品,销售增长率高,但竞争优势不明显,市场占有率低;出版物属于瘦狗类产品,受信息技术影响,销售增长率低,市场占有率也不高;手工艺
期刊
[摘要]从周武王、周公营建洛邑“天下之中”,到后来“天下之中”演变成一个重要的政治、文化概念,历代儒者不仅论证、阐释了洛邑“天下之中”的地理地位,还基于儒家的德政思想阐释“天下之中”的历史渊源和深刻内涵。运用意大利思想家安东尼奥·葛兰西提出的文化领导权理论解读儒家的“天下之中”观念,既可以准确理解“天下之中”观念的深刻内涵,又能够帮助我们深入思考儒家确立和传播“天下之中”观念对现代社会的启示意义:
期刊
[摘要]衡量现代博物馆建设水平的一项重要指标是其光环境的合理性。映入观者眼中的展品,其色彩之所以会有所不同,源于灯光在投射时还原质量的差异。通过对安徽省博物馆的调研,发现其照明设计存在以下问题:展示区照度均匀度不足、真迹馆眩光严重、展示大厅照明显色性不足。鉴于此,现代博物馆灯光设计应遵循如下原则:灯光照度均匀度应注重均衡统一原则、眩光的限制应注重舒适性原则、显色性应注重人性化原则。  [关键词]现
期刊
[摘要]河南省既是农业大省也是人口大省,改革开放以后又成为劳务输出大省,农村留守儿童数量庞大。以河南省周口市部分留守儿童为调查对象,发现当前农村留守儿童教育中存在家庭监护薄弱、学习成绩差,亲子沟通常年缺失、心理问题突出,家庭教育方式不当、道德品行失范等问题。农村留守儿童教育问题产生的根源在于我国长期实行的城乡二元经济结构和二元户籍制度。由于城乡二元经济结构和户籍制度很难在短期内得以消除,加之教育是
期刊
[摘要]随着中国自身的发展,中国政府适时抓住国际社会变化新趋势,提出了构建命运共同体的外交新理念。构建命运共同体是世界各国人民的共同愿望,也是中国主动承担国际责任、谋求与世界共同发展的正确选择。命运共同体作为包括中国人民在内的全世界人民的共同愿望和梦想,是世界不同性质、不同大小国家之间的最大公约数,包含平等互信的新型权力观、合作共赢的共同利益观和包容互鉴的文明观。长期以来,中国在国际安全、经济和人
期刊
[摘要]随着高等教育大众化时代的到来,大学生群体日益壮大,其存在与影响备受社会关注。20世纪西方著名精神分析学家弗洛姆,毕生致力于人的心理机制和性格结构的分析,其“逃避自由”思想对当代大学生网络迷恋心理困境分析有着重要的启示意义。弗洛姆的自由悖论生动地映照了当代大学生网络迷恋的心理矛盾,即自由与孤独并存。弗洛姆提出的确立“积极自由的存在状态”,为当代大学生走出网络迷恋心理困境指明了方向,其根本途径
期刊
[摘要]采用区位嫡指数对我国文化产业集聚水平进行测度发现,我国文化产业发展呈现出区域间文化产业集聚不平衡和区域间不同文化行业不平衡的状态。通过对影响我国整体文化产业集聚之因素的实证研究发现:社会包容性成为造成地区间文化产业集聚不平衡的重要因素,而文化资源禀赋、政策效应并不是造成地区间文化产业集聚不平衡的主要原因。此外,区位因素、缄默知识外溢和本地市场效应也会对文化产业集聚不平衡产生一定影响。为缩小
期刊
[摘要]学界研究发现,资源丰裕程度与经济增长并非线性关系。相对于线性模型,非线性模型可解决多重共线性问题,并大幅提高可决系数。基于非线性模型的实证研究显示,资源诅咒命题在中国整个大陆并不成立,但在一些区域是成立的,如东部、华东、华南、长三角地区;资源部门对经济增长的促进作用有限,金融部门对经济的促进作用明显高于资源部门,发展金融业有利于促进经济增长;在不同区域,发展金融业对经济的促进作用存在差异,
期刊