百度的“文心一言”,是拿国外开源AI生成了图画,再反给用户的?

来源:@刘大可先生

我今晚掌握的证据对百度非常不利。

他们最近推出的那个会画图的人工智能,“文心一言”,恐怕是和汉芯、鸿蒙一样的东西:套壳、画皮、造假。

这个猜测早就心照不宣了,说百度这个所谓的人工智能,其实就把中文句子机翻成英语单词,拿去用国外刚刚开源的人工智能“Stable Diffusion”生成了图画,再返回给你,说是自己画的。

对此,早先的直接证据是图1,让它画“鼠标和总线”,它会画出来“老鼠和公共汽车”,因为“鼠标”和“总线”的英文是“mouse”和“bus”,再比如图2,让它画“起重机”,它会莫名其妙地画出一个鹤的头,因为“起重机”的英文是“crane”,这个单词更常用的意思就是“鹤”。

500

500

间接的还有,如果关键词不加“中国”,那么画出来的都是白种人,连国旗都是星条旗,等等,不一而足。

但百度有不少拥趸,非说这是语义分析没做好、国外的图片资源更便宜之类的。

于是,我在今晚尝试了许多“中英歧义”的词组短语,得到了这一系列叫人作呕的结果:

最露骨的莫过于图3,“一可以豆子”,这在汉语里根本不是人话,但如果机翻成英语,“one can bean”,它就轻松地画出“一罐头豆子”。为了证明这不是个偶然,图4是“牛肉可以”,图5是“满冰箱可以”。

500

500

500

图4还启发我,英语里面只有常用肉有专门的词汇,罕见肉没有英语词汇,果然,如图6,让它画“羊肉和驴肉”,它只会画出羊肉,而驴肉只能画出一头驴,同时,因为它不理解这个句子,还让驴长了羊毛。

500

图7是“土耳其张开翅膀”,你猜它为什么画了个火鸡?同理,图8的“水瓜”当然要画个西瓜,图9的“牛奶路”画了个“银河”。

500

500

500

还有稍微妙一些的。图10是“云中的平面”,结果画了个飞机,这是因为“云中的平面”机翻之后是“plane in cloud”,那个英语的人工智能当然会画个飞机。

500

图11是“金色摔倒”,不出意外的话,它是机翻成了“golden fall”,也就是“金色的秋天”。

500

尤其值得一提的是图12,“中国论文”,它画了一幅山水画,为啥?因为论文是“paper”,但“chinese paper”是宣纸,所以它画了一幅水墨画象征宣纸。作为佐证。

500

图13是真正输入“中国纸”画出来的结果。无独有偶,图14是“法国粉笔”,它画了个法国人的“炭笔素描”(chalk)。

500

500

最后,图15是树叶封面苹果,“封面”就是“cover”,“cover”就是“覆盖”,很明白吧?

500

如果你也想试试,不用等着注册文心一言,这个画画的功能是独立的,名叫“文心一格”,直接搜就能找到。随便找个英汉词典就能揭开这层皮。

所以人们之前玩儿的那些画菜名,什么鱼香肉丝、松鼠鳜鱼、红烧狮子头,画出来的莫名其妙的东西,并不是人工智能天真可爱,而是汉译英的功夫不到家,难为了羊皮里的外国程序。

我觉得好丢人。无数次需要民族企业出来振作我的自豪感,那怕不是“领先”,就只是“紧随其后”这样的自豪感,却总有流氓出来恶心人,芯片是砂纸磨的,系统是外壳套的,连个不赚钱的人工智能都是机翻的……就难免让我恶及余胥。

当然,如果谁能铁证如山,证明百度这个人工智能真是自主研发,不是给国外的开源程序改头换面,只是出于各种各样的难言之隐,必须把汉语机翻成英语才能画出画来,如此难以置信的可能性竟然就是事实,我也是欣慰的,会觉得这是好事,是我小人之心了。

全部专栏