无人超市藏1000个印度人...亚马逊来了波神操作

网上流传一个段子,每台ATM里都藏了个人,你取钱的时候里面的人把钞票点好之后送出来。

谁能想到,这样一个段子竟然真实地发生在当下,甚至发生在被冠以“智能、前沿”的AI领域。

最近,科技巨头亚马逊旗下的生鲜门店,突然停用了零售支付技术 “Just Walk Out”。这项技术此前被一些人捧上天,被视为零售业的未来。

简单说,就是你在生鲜门店买完东西无需一样样结算,可以直接走出门。“Just Walk Out”技术会通过AI视频识别出你买的东西,然后给你发送账单进行支付。

500

亚马逊生鲜杂货店

这听起来有些类似国内的无人超市,省去了排队结账的繁琐流程。而且“出门后再结账”的操作,隐隐之中还有吃霸王餐的爽感。

然而,这样高大上的人工智能,最近却被爆出实际要靠人工来实现“智能”。有美国媒体指出,“Just Walk Out”技术背后有1000多个印度工在人眼验货。他们在监控器后面,手动审查账单与货品是否匹配。

想想这幅画面,跟ATM里藏人没啥区别。彼时的人工智能,如今更像是人工智障。

无独有偶,最近初创公司Cognition AI号称的“全球首个AI程序员”Devin,被曝存在造假。此前的AI建模软件公司Kaedim,也被爆出产品背后是人工在操作。

这种“挂羊头卖狗肉”的戏码,为何在AI圈越来越多?

亚马逊:理想很饱满,现实很骨感

“Just Walk Out”技术,并不复杂。亚马逊的零售蓝图,也很美好。

2016年,亚马逊在公布“Just Walk Out”技术的时候,曾描述了这样一幅蓝图:“如果我们能够将最先进的机器学习、计算机视觉和人工智能融入到商店的结构中,这样你就不用排队等候了。”

的确,对于很多人来说,购物总是兴奋的,排队总是痛苦的。如果能拎包就走,无疑是快乐的。

为了实现这幅蓝图,亚马逊专门为门店设计了一套流程框架:

500

顾客在进入门店之前,需要提前下载并安装一个名为“Amazon Go”的手机App,注册并录入个人资料,包括个人ID、支付账户等等,随后平台会创建一个“虚拟购物车”。

500

另外,顾客在进店时还会经过类似于地铁站的闸口。

500

进入商店之后,顾客可以随意购物。同时,亚马逊在门店里配置的摄像头和传感器会实时捕获这些购物行为,然后将视频发送到亚马逊云端进行处理,这些统称为“流媒体服务”。

500

流媒体服务的核心就是“Just Walk Out”技术,它相当于整个商店的大脑,包含了对象识别、人员检测、姿势预估、活动分析,传感器融合以及校准等一系列技术,目的就是解决一个问题:

谁?拿了什么商品?

首先是“谁”的问题,即如何定位顾客的轨迹。

如果商店只有一个人,那么就很好进行定位。但是如果挤满了人就会导致彼此遮挡,定位的难度就会大大提升。“Just Walk Out”的解决方案是通过定位器、链接器和复杂状态解析器三个模块,持续跟踪顾客路线。

500

其次就是“顾客拿了什么商品“的问题。

一些商品在外观上看起来非常相似,仅仅通过摄像头还难以辨认。为解决这个问题,“Just Walk Out”结合了所谓“基于残差网络的细粒度计算机视觉算法”,能够更精准地识别商品。

顾客选购完毕之后,“Just Walk Out”的AI系统会计算好货款,直接从顾客提供的账户上扣款。

这么看下来,亚马逊描述的零售蓝图的确具备吸引力,也被业内不少人极力吹捧,认为其降低了人力成本,提升了零售体验和效率。此后,“Just Walk Out”技术被部署在20家Amazon Go 商店、40家Amazon Fresh杂货店和两家Whole Foods商店。

500

然而,理想很饱满,现实却很骨感。亚马逊满心欢喜地推广“Just Walk Out”后发现,事情越来越不对劲。总结下来,就是:

低估了流程和人性的复杂度。

要知道,顾客在商店里购物,并不是如同机器一样执行死板的程序,而是会产生更为复杂和多变的场景。

比如,你买了二十样商品放在购物车里,但临时决定不买其中的十件,其中五件在放回的时候放错了货架。同时,你跟爱人分别有一个购物车,买完东西后汇总到了同一个购物车......

要处理这些复杂场景,估计摄像头背后的AI系统已经烧冒烟了......经常有顾客吐槽,走出商店后几个小时后才收到账单。

为了进一步提高效率,亚马逊尝试开发更高效的传感器,然而成本太高。其目标是将一个传感器的价格降低到100美元,但工程团队只能降到350美元。

在效率和成本之间,亚马逊最终找到了一个平衡——印度人。面对复杂场景,亚马逊招聘了1000多个印度人,让他们看着摄像头连接的监控屏幕,用人眼来验货、结账。

据The Information报告,2022年中期亚马逊无人商店里70%的结算需要人工审核,如今这一数字仍高达20%~50%,远高于亚马逊的内部目标。

因此,有人调侃亚马逊的AI其实是“All Indians”。这种AI属于劳动密集型科技,不仅不会抢走人类的工作,还能创造更多的就业。

500

除了低估流程的繁琐度,亚马逊还低估了人性的复杂度。

在此次停用“Just Walk Out”的公告中,亚马逊表示虽然“Just Walk Out”能带来无需排队结账的体验,但顾客还是希望在购物时就能看到产品的总价、折扣、以及能省多少钱。

说白了,一些人在购物时都有“占便宜”的心理。他们并不是只在意排队结账,还在乎能优惠多少。

这次亚马逊停用“Just Walk Out”背后,显露出它的两个短板:既没搞好科技,也没搞懂人性。

亚马逊的“同路人”:造假花样,各有不同

跟亚马逊一样,深陷“AI造假”风波的科技企业,不在少数。

前不久,AI初创公司Cognition 宣称,自家推出的Devin是全球首位完全自主的AI程序员。它不仅能自主学习陌生的技术,构建和部署应用程序,还能自己改bug、训练和微调AI模型。

500

为了让公众更清晰地看到Devin如何工作,Cognition还专门用视频Demo进行演示,赚足了高人气。

500

然而,高光时刻还没持续多久,Cognition就迎来了打脸。最近,油管程序员博主Internet of Bugs对Devin的视频进行了逐帧分析,发现它并不如演示中那般神奇,甚至存在造假的可能,这在网上引起舆论漩涡。

500

该博主的“打假过程”太长就不展开讲,总结下来就是在“智商”方面,该博主不相信Devin真如Cognition宣传的那样能够理解任何事物。并且他认为软件开发者的工作中最难的、最关键的、最耗时的一部分,主要就是:沟通。

在这一点上,Devin的表现并不像视频演示中的那样出色。

干活效率方面,该博主自己复制了Devin做的任务,花费了大约36分钟,而Devin用了至少6个小时,甚至超过一天。

因此,很多网友开始质疑Devin的诞生更多是在炒作。视频里演示的Devin,实际上是人工操作的结果。

500

跟Cognition 、亚马逊一样深陷造假风波的,还有Kaedim。

最近,硅谷风险投资巨头a16z又一次进军AI领域,领投了一家名为Kaedim的AI建模软件公司,金额达到1500万美元,这家公司被a16z称为“3D世界的下一代合作开发平台”。

此前,Kaedim宣称自己的AI技术,可以将二维图像转换为三维模型。用户仅需上传一张图片,Kaedim就能将图片中的2D物体生成为3D形态。该公司还对公众宣传,不要再把时间浪费在建模工具上。

500

Kaedim的创始人康斯坦蒂娜·普索玛入选了《福布斯》欧洲30位30岁以下精英榜,她曾对《福布斯》表示:

自家产品全程不需要人工参与,完全实现自动化。

不过,很快有人发现Kaedim的产品有猫腻。比如,产品太像人类了,创建的模型线条太过流畅,而且还会犯下建模师才会犯的错误,响应时间也比较长。

另外,还有眼尖网友发现Kaedim在招聘启事上有这样的要求:应聘者在接到客户要求后15分钟内,能够制作出“低质量”3D图像。

种种迹象表明,Kaedim产品背后可能是人工主导,而非AI。不过,Kaedim方面此前一直矢口否认。

后来,技术门户网站404 Media发布一项调查显示,Kaedim产品背后借助了大量的人工操作。有的3D建模全部由人类完成,没有使用任何AI。

调查还指出,Kaedim从世界各地招聘众多建模人员,全天候待命为用户服务。这些建模人员所得报酬仅为每个模型1美元~4美元,而Kaedim向用户收取的费用达到15美元。

500

这样来看,Kaedim并非属于AI圈,而是属于外包圈。

在调研报告和用户舆论的高压下,Kaedim最终承认人工参与了3D建模工作,原因是产品质量远达不到实用,需要人工去不断调整修正。

前不久,Kaedim又发布新产品帮助用户3D建模,这次它只是说明新产品旨在:

增强而不是取代建模师。

求生欲满满。

很多用户其实很纳闷,明明都是科技巨头或者明星创业公司,可以做点坦荡大气一点的事,为何在打造AI产品上要“挂羊头卖狗肉”呢?

这要从当下的AI竞争环境说起。

为何要“挂羊头卖狗肉”?

对于大部分科技企业而言,AI无疑是新的风口和掘金地。不过,这片掘金地里的竞争是极为残酷的。

在头部的科技企业行列,你追我赶的角逐态势愈演愈烈,竞争更加白热化。微软、苹果、谷歌、Meta、亚马逊等几大科技巨头中,微软凭借手握OpenAI这张王牌和微软云的充沛算力,走在队伍前列。

谷歌正通过大模型重塑旗下所有业务,跟微软在AI上的明争暗斗从未停止。Meta很早就在AI上进行布局,实力不俗。苹果如今放弃造车,也要全力进军AI。

反观亚马逊,其坐拥AWS这样的老牌云厂商,却没有在此次生成式AI浪潮中做出惊艳的成绩,市场对亚马逊的AI能力存在一定的担忧。

500

为了在AI浪潮中成为冲在前列的弄潮儿,亚马逊的步子可以说迈得相当大,在各个领域都想尝试,但在部分领域走得过于激进,零售板块里的“Just Walk Out”就是一个典型。它用在小型商店尚可,用在大型商超很难落地。

吹出去的牛不好收回,只能用人工替代人工智能硬扛了,反正地主家余粮够多,试错成本低。

500

不过,对于Cognition这样的AI初创企业来说,试错成本越来越高。

风投公司Theory Ventures调查数据显示,在所有AIGC公司中,95%的公司年收入平均还不到500万美元,一些估值达到数亿美元的初创公司甚至还未有收入进账。

今年以来,AI赛道上赚钱难的问题仍在继续。入不敷出的形势下,一些AI初创企业开始承受巨大经营压力,甚至走向被收购或者倒闭的结局。

比如,此前不屑于卖广告,并且批评谷歌广告太多的AI搜索引擎Perplexity,最近也迫于经营压力卖起了广告。

主打AI个性化新闻推荐的Artifact,一度成为市场焦点。但是由于始终未能找到足够多的受众,导致其业绩不振现金流告急,无奈在今年1月关停,前不久被雅虎收购。

500

在趋于严峻的行业形势下,AI初创企业首先要做的是吸引资本、备足粮草,保证现金流安全。然而,经历狂热期后,资本对于AI初创公司的态度逐渐趋于冷静和理性。

研究机构CB Insights发布《2023年人工智能(AI)行业现状报告》,2023年全球AI初创公司融资总额比2022年下降10%,融资交易量创下了自2017年以来行业新低。

当资本变得愈发有限和理性,要想获得投资机构的注意,就必须会讲故事,让资本觉得有利可图。哪怕这个故事是掺了水分的。

500

Cognition,就是很会讲故事的那一个。

自其宣布推出全球首个AI程序员后,就吸引了大量资本注意。华尔街日报报道,今年3月31日Cognition在与投资者洽谈,目标以最高20亿美元的估值募集资金。

要知道,Cognition刚刚宣布完成A轮融资,估值仅为3.5亿美元。如果新一轮融资完成,Cognition估值在几周内就翻了6倍,堪比火箭速度。

可见,Cognition不一定掌握了AI的核心技术,但一定掌握了吸引资本的能力。

历史似乎总是轮回的。

21世纪这些科技企业“挂羊头卖狗肉”的神操作,在18世纪也同样上演过。当时,有人发明了一种能够自动下棋的机器,被称为“土耳其行棋傀儡”。这个机器在欧美地区打败了许多棋手,吸引眼球的同时赚得盆满钵满。

结果,几十年后人们才发现机器里藏着一位真正的棋手。

500

几百年过去,科技在进步在改变,但人类赚钱的方式却没怎么变。

全部专栏