“大数据扼杀熟悉度”的话题引发争议已经不是第一次了。被投诉最多的是电商、外卖和出租车。关于黑猫投诉大数据培训是骗局,仍有网友在2019年1月提交的投诉未处理。今年3月,复旦大学孙金云教授花费近5万元乘坐出租车800次。
图/微博投票
在网友对“大数据杀戮”现象表示不满和谴责后,终于有了官方回应。4月8日,唯品会、京东、美团、饿了么、每日优鲜、盒马生鲜、携程、去哪儿、如气出行、滴滴出行等10家互联网平台签署承诺书:“不哄抬物价,没有数据优势。”
“我们的推荐算法不同于其他内容平台,我们根据不同人群的出行方式推荐最优的出行路线和性价比最高的方式。推荐系统是不断迭代的,不可能一下子解决所有问题。” 一位该领域的大数据算法工程师告诉坦克“”。
那么,这些算法是如何一步步融入我们的日常生活的呢?“推荐算法”对商家和用户来说有哪些优缺点?作为互联网用户,我们如何才能最大限度地保护我们的数据隐私?
1.算法让你隐形
公司如何使用数据算法让你“一目了然”?
“(企业)通过算法和平台未明确说明的行为来猜测用户的秘密,例如购物兴趣和其他行为兴趣。通过行为猜测一个人的兴趣或购物倾向的概念并不新鲜。他们会猜测和对方交谈得到的信息,以及他们穿的衣服,他们称之为‘霸皇’。” 《计算广告》作者刘鹏在科普视频中生动地解释了推荐算法的基本逻辑,而他的另一个身份就是知乎的大V“北冥程海生”。曾在一家科技公司负责大数据实现相关业务。
除了科技圈专业人士的意见,学术界的科研团队也进一步验证了推荐算法的“神算”。
2020年,孙锦云教授带领20余人的团队,在北京、上海、深圳、成都、重庆等地进行了800余场实地考察,花费了近5万元的出租车费,得出了一个惊人的结论,那就是,用户手机打车软件分为三、六、九等。手机越贵,打车越贵。
大数据根据您使用的手机品牌判断您的消费能力,甚至为您量身定制充电标准。这是成千上万人的互联网吗?
图/人民网官微
你认为你的手机有多少电池是隐私?大多数人可能会说不。但实际上,电量反映了一个非常重要的信息——如果手机电量已经充满或者一直在增加,则说明手机处于充电状态,用户很可能在室内。
此外,手机中用来测量我们的步伐和判断运动姿势的传感器陀螺仪可以判断用户的运动状态,无论你是走路、跑步、开车还是坐地铁都逃不过它的“眼睛”。
“如果手机的电池一直是满的,可以判断是插在充电线上,从行驶的速度上可以判断,而且这种状态一天可以持续十个小时,那么可以判断,这个人的职业是出租车司机。”
“再比如,你认为手机系统有可能知道你的工作地点和家庭住址吗?如果你想知道你去哪里上班,系统只需要每天十点对你进行采样如果它发现一个月有 20 天你都在同一个地方,那么你基本上可以确定你在哪里工作。同样,如果你把采样时间放在晚上 12 点,你可以得出你家在哪里的结论。” 刘鹏通过两个简单的例子说明了大数据是如何知道个人信息的。
从某种意义上说,今天的移动设备已经成为了你的“器官”,你很难想象除了睡觉之外,你可以不带手机出门的场景。由于它是一个器官,它可能会泄露你的很多隐私。毕竟手机上有很多传感器,可以学习到很多个人信息,而一些获取信息的方式也是非专业人士无法想象的。
“我想让人们知道的是,他们在网上所做的一切都会受到监控、跟踪和评估。您所做的每一个动作都会被仔细监控和记录,直到您停下来。你看一张照片多久可以被记录下来,”前高管杰夫在纪录片《监视资本主义:智能陷阱》中说。
算法可能比你更了解你自己。它了解您的情绪,无论您是内向还是外向,并拥有您的所有个人信息。还有什么比这更可怕的呢?
2、落入“算法陷阱”
确实有人说算法推荐的东西更符合自己的心意,节省挑选的时间;但也有人说我们刚刚掉进了“算法陷阱”。
让我们首先看看算法如何更智能地了解我们的偏好并相应地提出建议。
“你可以通过数据来判断你是否是一个对价格敏感的人。以电商为例,很多卖家会在一个平台上开十几家店铺,同一产品在每家店铺的价格不同。算法会向你推荐你能承受的价格。不可能消除价格歧视,这违反了商业的本质。只是意味着在互联网的条件下变得更容易实现。” 刘鹏告诉坦克“”。
科技公司收集用户数据后,会创建一个预测用户行为的模型。数据越多,模型就越准确。每个人在屏幕上进行的每一次点击,无论是点赞、不感兴趣、点赞等,这些数据都会变成一个数据库,从而塑造为您制作的模型。
毕竟在市场竞争中,一旦获得更多的用户数据,做出更精准的模型,公司就有机会占据更大的市场空间。
图/A站《监视资本主义:智能陷阱》纪录片
“互联网的推荐逻辑主要看你的目标函数是什么,比如内容推荐,是让点击率更高,浏览时间更长,还是让用户的满意度更高,不同目标函数的推荐逻辑会不一样,不一样。经过不断的正反馈,算法的准确率会越来越高,推荐也会越来越准确。” 刘鹏向坦克“介绍”。
互联网的出现给很多人带来了便利,但技术是一把双刃剑。系统对你的了解越多,大数据向你推荐的东西就越准确,这会让你花更多的时间在他们身上。在应用程序上,让你越来越沉迷于手机。
对此大数据培训是骗局,目前流行的社交软件也利用推荐算法来吸引用户的注意力,最终让用户陷入“刷的越来越长”的状态。
例如,社交平台上的点赞和评论等短期信号可以给人心理上的满足感。这种满足感是对人的一种“奖励”。得到奖励后,人们会期待下一次。有更大的满足感。这是人们沉迷于社交网络的重要原因之一。
“美国青少年的抑郁和焦虑急剧增加,青少年自残甚至自杀的人数急剧上升,10 至 14 岁女孩的自残率增加了 151%。这增长模式指向社交媒体。”纽约大学斯特恩商学院的社会心理学家海特博士说。这是整个社会落入“算法陷阱”的另一个方面。
1996年以后出生的孩子从初中就开始使用社交媒体,00后被称为“互联网原住民”。这些年轻人更熟悉网络生活,更容易因网络环境而焦虑、脆弱或抑郁。情绪。此前的调查显示,很多年轻人都有“手机焦虑症”。一旦手机不在手边,他们就会陷入焦虑,不知所措。
在一定程度上,这种新型症状出现的原因之一是算法更能吸引人们沉浸在手机应用中,让人觉得“玩手机很开心”。手机让人们的生活更加便捷,算法让人们更加沉浸其中,最终人们离不开手机上的虚拟世界。
3.正确理解推荐算法
客观地说,任何技术创新都离不开利弊并存,推荐算法也是如此。
“首先我们不能妖魔化它,如果你今天不能通过数据了解你的喜好,那么你收到的信息流就会很混乱,体验会更差。人们担心隐私被利用,但使用数据的目的实际上只是为您提供个性化的内容和广告,用户实际上并没有任何损失,平台也不会拿出您的数据进行交换或出售。从经济利益的角度来看,他们做这些事情是不值得的。产出比例不平衡。”刘鹏从企业的角度向坦克解释道。
事实上,我们国家对数据的使用有一定的标准,有些界限是不能触及的,比如用户的电话号码、E-mail和身份证号码。对于很多人来说,数据泄露的风险并不是来自这些大平台,而是可能发生在一些小平台,或者公司内部的个人身上,比如可以看到数据的员工,从数据库中偷偷你的快递地址。倒出来卖掉。
“不可能通过法律法规彻底解决数据保护问题,更多地依靠技术手段,比如对核心领域进行加密,保证内部工程师看不到数据信息。” 刘鹏告诉坦克“”想要真正解决数据保护还是要靠技术手段。目前,在数据安全保护问题上,BAT等公司都有团队在做相关加密技术的研发。
/ 网络,基于 VRF 协议
另外,还有一个困扰大家很久的问题——应用真的听我们的吗?这是推荐算法的一种手段吗?
“这个原则上是可以的,但是实用性很差。如果软件要24/7听,需要在App里面开启录音功能,耗电很大,你的手机很快就没了电,我个人认为是不可能的,如果是文字和输入法,还是可以的。” 刘鹏从专业的角度为我们解答了这个问题。如果用户仍然担心这个问题,可以考虑在手机设置中关闭某些软件的麦克风权限。
另外,很多用户对电商平台的推荐算法还有一个疑问——为什么我们买的东西还是推荐?算法不知道我们已经购买了该物品吗?这是否表明它不够聪明?
“其实这是因为很多用户的重复购买率很高。从技术上讲,平台很容易让算法停止推荐用户已经购买过的东西,但从利润的角度来看,重复建议非常有效。” 刘鹏对客人说“”。
本质上,数据和算法本身就是为了让平台更精准的推送给目标用户,让用户有更好的体验,但在技术发展的过程中,难免会遇到各种情况。也会根据不同的需求制定不同的推荐逻辑。
也许一个算法会导致社会两极分化,甚至让你被操纵,无法摆脱算法为你打造的模型,落入“信息茧”。但在一定程度上,算法也在便利我们的生活。
我们真正需要的是科技行业开发更好的技术手段来规避现有问题,而制定和运行算法的人对其行为有更高的道德要求,而政策法规对人们的数据安全有更严格的规定来保护,用户可以有更广阔的视野和独立思考的能力。
可以看出,这仍然是一个全社会的问题,需要大家在探索的同时,共同努力提高。正如人们提出的大数据杀戮问题一样,它也有被解决和优化的可能。归根结底,我们希望在未来看到的只是推荐算法不仅更智能,而且更良性。
*文中题图来自:Photo ,基于VRF协议。