AI幻觉泛滥的时代,也是搜索价值被重估的时代

没有假,就没有真。

文|陈梅希

编|园长

几周前,刺猬公社发起过一场“认出那个AI作家”的测试,用部分作家原文,和Deepseek、Kimi等AI产品模仿作家风格生成的文本,组成了一套共25道的测试题。

没想到,在准备题目的过程中,就已经先行遭遇了AI幻觉的“背刺”。

AI帮我收集了10段沈从文本人写的内容。但是等等!“一切都那么宁静那么美好。”这种画风格格不入的句子,真的是现代文学大家沈从文写出来的吗?

于是,我不得不打开百度,一段段查证这些AI收集的文本是否真实。结果发现,10段内容中有6条都是编造的,其中1条内容甚至是某位网友发布的沈从文小说读后感。

当我们的AI朋友变得越来越智能、越来越体贴时,一种观点认为,搜索引擎很快就将不复存在,AI助手将取而代之,成为大众日常获取信息和知识的主要渠道。

但事实是,曾经一度被调侃为“网络检测器”的搜索引擎,正在AI生成时代重新证明自己的价值。最核心的原因,是在初期的兴奋退却后,人们发现,AI不止拥有了人类的智慧,也学会了人类的谎言。

校验信息准确度的需求,与AI的生成能力一同涌现;假如AI欺骗了你,至少还有搜索引擎为信息兜底。

500

被AI哄骗,正在成为一种常态

过去两年,生成式AI将内容生产效率推向此前从未有过的高度,但风险和挑战随之而来——消费AI生产的内容和被AI哄骗,正在同时成为一种常态。

AI的“骗”,主要包括因幻觉问题而产生的胡编乱造,例如杜撰不存在的餐厅、编造未发生的事件。而随着文本生成能力的提升,AI已能为虚构信息编造足够多的细节,进一步加大普通用户对于真假信息的辨别难度。

今年春节假期,在巴塞罗那旅行的王宇,让当时爆火的Deepseek为自己推荐餐厅,得到了五个完整的推荐列表。王宇一眼相中了其中一家名叫“Restaurante Tio Che”的餐厅,Deepseek将其绘声绘色地描述为“加泰罗尼亚打工人的食堂”,每日会更换平价套餐,人均10欧元的套餐内包含汤、主菜、甜点和面包。

500

受访者供图

试试“D老师严选”的提议很快获得了同伴的认可,但当王宇准备导航前往时,才发现地图软件中根本无法找到这个目的地。他用搜索引擎寻找这家餐厅的信息,才发现一切都是被编造的——他输入D老师提供的餐厅地址,发现那里只有一个轮胎店,而且还不是“米其林轮胎”。

500

500

受访者供图

不死心的王宇又搜索了Deepseek推荐的另一家餐厅,发现同样是被虚构的。“剩下几家是不是假的我不知道,因为我只试了两家,都不存在,然后就放弃了。”

AI在推荐餐厅时胡编乱造,最多只会浪费一点用户的时间和感情,但如果相同场景搬到教育、医疗、法律等专业领域,一旦错误信息被简单采信,将给用户造成更多实质性困扰。

Vlog博主小卢曾在小红书分享让AI帮忙搜集论文相关文献的惨痛经历。“我把之前的文献放到百度上,发现要么就是查不到出处,要么就是年限太远不能用。昨天凌晨3点30还在改论文……”靠AI用几秒钟生成的信息,最终要花好几个小时在搜索引擎上校验。小卢最后还是放弃了耍小聪明,老老实实地让百度AI罗列相关文献信息和链接,再逐一搜索查看确认。

500

AI的“哄“,则是另外一种隐藏在答案背后的偏向性判断。随着AI深度思考过程的白盒化,越来越多用户发现,为了”哄“人高兴,AI会思考提问者的立场,给出提问者想听的答案,而不是正确或客观的答案。

人与人之间,会因为谎言而产生信任危机,人与生成式AI的信任关系甚至更为脆弱脆弱。南方都市报调查显示,68.63%的用户表示担忧生成式AI的虚假信息与诈骗。一旦经历过AI“哄骗”,用户很难再保持百分百信任,“狼来了”的故事,在AI时代同样奏效。

而当用户对AI生成的内容产生疑虑时,会天然产生校验的诉求——搜索引擎依然是校验信息的最主要工具。甚至,AI幻觉越泛滥,用户对AI生成内容的信任度越低,使用搜索引擎校验的需求也越高。

AI非但不会取代搜索引擎,反而会驱动用户重回搜索。

500

AI是手段,而不是目的

此前,刺猬公社曾发起过一场问卷测试,将鲁迅文本和AI模仿鲁迅风格生成的新文本打乱顺序,交给参与者判断。测试结果显示,只有6.5%的用户能百分百区分鲁迅和AI模仿的鲁迅,58%的用户得分低于90分。

500

测试中准确率最低的一道题,近40%的参与者误以为这段AI文本来自鲁迅

一位仅获得68分的测试者告诉刺猬公社,错题集中在由Kimi和Deepseek模仿生成的文本中,他对鲁迅作品的了解主要来自中学时期的课本,算不上熟悉,那些由AI生成的、意象丰富的句子对他来说辨别难度太高。

生成式AI的加速发展,看似降低了知识获取的门槛,所有用户只需要一个对话窗口,就能不断获取藏匿于世界任何角落的信息。但只要AI还在持续“说谎”,辨别能力和校验能力,就会成为获取知识的新门槛——一个工科专业硕士毕业的成年人,知道如何通过图书馆借阅鲁迅全集,却只能在一场AI鲁迅的测试中得到68分。

问题的关键在于,用户本不应该承担过高的辨别和校验成本。从体验视角看,用户期待的是获得可信的优质信息,而不是拿到足以把自己淹没的垃圾信息,再从垃圾堆里找可用信息。

在4月20日的万象大会上,百度副总裁、百度搜索总经理赵世奇表达了类似的观点:“我们认为,用户要的不是信息轰炸,内容生态的下一程,一定不是比谁生产的更多更快,而是比谁创作的内容更可信、更优质,真正为用户提供价值。”

尤其对于搜索业务来说,使用AI不应该成为目的,而应该成为协助用户获取优质内容的手段,让用户更高效地实现“所搜即所得“。既要搭上AI时代的快车,又要保障内容可信度,百度搜索从内容端和分发端,主动接过了筛选优质信息的责任。

内容供给侧,百度拥有牢固的优质内容基础。

百度百科依然是当前中文互联网世界最全面、最权威的词条内容产品。很多用户会以百科截图作为辨别事件真伪的证据,对AI生成内容的真实性产生疑虑时,百度百科相关词条的释义,也成为大众对于真相的校准器。

百度百科既是一个内容产品,某种程度上,也是一个工具产品。越是在信息繁杂的时代,作为信息标尺的百科就越需要关注内容的真实性——它可以不讨好用户,但一定需要百分百准确。为了让内容创作者和用户之间建立零距离信任,百度百科升级“本尊认证”功能,支持创作者本人编辑词条,确保信息准确真实。

分发侧,赵世奇认为,百度搜索的价值不是简单的信息“搬运工”,而是优质内容的“筛选器”。

对于平台来说,分发即筛选,流量的分配方式,本来就承载着平台对于内容价值的取向和判断。赵世奇在发言中透露,百度搜索将从技术手段和使用场景入手,将搜索流量导向真实可信的优质内容。

技术手段上,百度搜索利用智能评估 、溯源校准、权威认证三重机制,确保搜索结果真实可溯源。智能评估是基础准备,利用评估模型,将优质内容送入优先分发池,获得更多流量;溯源校准机制,则让每一次AI搜索,都优先展示官网、权威媒体、行业达人等优质权威内容源;权威认证机制则让优质内容源获得“认证标签”并优先展示,让用户能一眼看见“防伪码”,找到稳定可靠的信源。

使用场景上,百度最新推出的百看模式,则进一步帮用户提前完成信息整合和筛选,通过结构化、多模态的展示方式,让用户一次性获得所有可能需要的信息。

刺猬公社在百度寻求埃及旅行建议时发现,只需提出一个简单的问题,例如“埃及赫尔格达有哪些好玩的”,就能获得由AI处理过的,结构化呈现的高价值信息。其中既有海上活动、沙漠探险等不同类型的活动攻略,也有餐厅推荐、联系方式等实用信息,甚至还包括一条长达11分钟的中英双语字幕的赫尔格达旅行vlog。

500

百看模式下的赫尔格达旅行攻略

500

最终成行的游艇出海之旅,作者拍摄

集成文字框架、图片、视频、链接、智能体等多元化呈现方式的百看模式,能让用户做到使用一次搜索,就掌握全部有效信息。

整体来看,百度搜索对自身内容生态的认知非常清晰:守好内容质量底线、优先筛选分发高质量内容、以AI辅助优质信息呈现。将AI作为手段而不是目的,才能放大搜索业务在AI时代的稀缺价值。

500

搜索生态,知识的守城者

真实和虚假,是一组共生的概念,当我们无法判断什么是虚假时,真实也将失去边界。这是我们认为,生成式AI发展越蓬勃,搜索越有价值的原因。我们需要具有确定性的信息和知识,它们来自客观规律而非主观幻想,它们不会因为提问者的心情和立场而变换答案。

给内容以确定性,正是一个健康的搜索生态所应该具有的职能。为了达成这种职能,平台侧以技术护航,以分发优质内容为导向;而在平台背后,则是无数专业和通识领域的内容贡献者。

百度百科有794万的贡献用户,他们来自社会各界,可能是高校学者、各领域的专家,也可能是一个普通学生,一个资深爱好者,或是一个在某领域有一技之长的工人。跨过社会身份的限制,只要能编辑真实、可信的词条,人人都能成为知识的贡献者。这是一个特殊的、紧密的、无法被击破的知识共同体。

而在教育、法律、医疗等专业化知识领域,百度拥有丰富的历史信息积累和强大的知识“造血能力”。

例如医疗领域,范铁兵等23000多名专业医生和百度共建千万级病案库,通过AI技术辅助用户找到相似病例,实现患者与医生的精准匹配。法律领域,张嘉良等执业律师,将多年从业经验沉淀到数字分身,同步开展普法直播、答复万人在线咨询,让律师能够更聚焦处理关键事务。

这些案例中,解决问题,成为了搜索业务的延长线。百度的AI技术帮助领域专家更高效地普及知识、处理问题,也让用户在获得信息之后,迅速链接所需资源,进入解决实际问题的流程。

在“真实可溯源,优质即流量”的搜索生态定位下,百度无疑也将向更多优质、专业的内容生产者敞开新的大门。在演讲的最后环节,赵世奇对现场的创作者说:“当信息爆炸的迷雾散去,用户最终追随的,永远是源头可溯的真相,是经得起时间检验的信任。”

是人类共同构建的搜索生态,组成了知识的第一重城门,让作为最后一重城门的图书馆不必暴露在外。

在AI幻觉泛滥的时代,守住可信的搜索生态,就是守住真实和知识的最小半径。

(本文中,王宇为化名。)

参考资料:

1.《AI暂时生成不了鲁迅和张爱玲,但别高兴太早》,刺猬公社。

站务

全部专栏