一键量产垃圾,人类:我谢谢你

在2023年的《完蛋!我被美女包围了!》爆火之前,你就有机会喊出同样的句式。

500

只要在2021年用谷歌搜索中文内容,肯定会发出这句感叹,“完蛋!我被百科知识网包围了!”

满屏都是“XX知识网”“XX百科网”的链接,域名全是脸滚键盘打出来的乱码,内容全是程序生成的废话。

500

互联网界的丧尸围城,也不过如此

这种装满垃圾信息的网站,就是内容农场的一种。

什么是内容农场呢?顾名思义,这种网站大量“养殖”内容,内容质量是高是低,不重要,只要把人骗进网站里,站长就能赚到广告费,成功噶韭菜。

500

页面明显分成三部分,第一部分第一句话是有用信息,其他全是废话和广告

如果按照这种定义,很多互联网大厂的“某某号”平台,也能看作是内容农场。但我们一般不这样定义,因为大厂平台转载内容,一般都获得了原作者的正规授权,而垃圾内容农场属于私自盗窃别人的工作成果。

一般的小农场,圈一波钱之后立刻跑路,像是前边说的“XX知识网”,现在都上不去了。

但在中文内容农场里有个“日不落”传奇,这家名叫“每日头条kknews”的内容农场,每个月有6000多万访问量,靠着吃Google AdSense的广告收入,站长月入100万,美元。

500

这就是互联网垃圾信息的最终形态吗?当然不是。

前几天央视曝光了一家国内的MCN机构,靠着AI技术采集热点信息,批量生产虚假新闻,图文并茂,每天能生产几千条。

500

这种模式像极了内容农场,但它的本质是营销号。

互联网垃圾信息的生产模式,就是从内容农场升级到营销号,再升级到AI胡言乱语的过程。

01

内容农场,上古互联网遗毒

国外早期的内容农场里不一定有机器人,但一定有活人。

像是Demand Media这家公司,2009年左右玩得风生水起。

500

Demand Media收购了很多网站,教人做事的 eHow.com 就是其中之一

公司老板发现,做生意的人很笨,明明产品和服务质量很高,但不会打广告。于是Demand Media瞄准了“广告如何触达用户”这个蓝海市场。

比如有人想买二手车,在当时的谷歌里搜索相关问题,大概率找不到卖二手车的商家。Demand Media雇佣一堆写手,批量生产“二手车在哪买”的同类文章。

这坨文章里并未提供去哪买车的实用建议,而是反复重复“买卖、二手车”等关键词,并且贴上一堆跟二手车无关的广告链接。

500

人类的特点是复读机,互联网的特点也是。关键词重复多了,就能提高在搜索引擎里的排名。

靠着这堆互联网垃圾,Demand Media在2011年公开募股,估值15亿美元。但是不到3个月,网站的流量暴跌40%,因为谷歌更新了算法。算法更着更着,就把Demand Media更没了。

靠着玩弄算法暴富,迟早会被算法反噬。

后来的内容农场都学聪明了,它们不搞大阵仗,闷声噶韭菜。而且不生产内容,只是内容的搬运工。

最常用的方法是直接爬取别人的文章成品,讲究一点的,要给文章掐头去尾、随意魔改,显得像是原创。

拼凑信息这条路就比较随性了,用爬虫从各种网站上搜刮只言片语,配上经典的“小编体”,车轱辘话能把你绕出二里地。

500

小编体生成器

更高级的路线是机翻外网,它们最爱翻Stack Overflow、GitHub这类网站,所以我们搜索科技、编程类的信息时,能经常会被机翻信息荼毒。

甚至简单机翻不能满足它们的需求,必须英译中译英译中,多倒腾几遍,让读者难以反查内容来源。

是个正常人都能看出来,内容农场100%是垃圾网站,为什么还能排在搜索引擎的第一页?

因为它们精通SEO技术,也就是search engine optimization,搜索引擎优化。简单来说就是,搜索引擎爱看什么,内容农场就做什么。

500

有人专门卖SEO课程

最弱智的“小编体”,本意不是给人看的,而是给搜索算法看的。每重复一次废话,就能在搜索权重里提高一点。量变产生质变,说的就是这个道理。

但是“每日头条”“壹读”这种服务器在国外的大型内容农场,走出了不同的路。

微信公众号这类中文信息孤岛里有非常多高质量内容,但它们不对搜索引擎开放。所以大型内容农场瞄准这块空白,专门从公众号里扒内容。

被原作者发现怎么办?这些网站屏蔽大陆IP,没点技术手段,原作者根本不知道自己的创作被盗用了。

500

所以在搜索引擎眼里,你这个内容农场简直太优秀了,全是高质量独家内容,每天更新几十上百篇文章,这得雇多少牛马每天写稿啊!绝对是小微企业无法触及的高度!良心原创网站必须推到前排!

500

我们的文章,也被某些内容农场祸害了

现在使用搜索引擎的人越来越少,很多人把微信、抖音等平台当作搜索引擎来用,这些地方同样充满了垃圾信息,而且是2.0版本。

02

营销号,互联网的“注水肉”

我们经常能看到各种“清朗行动”,每次出手都能精准封禁无良账号。这类无良帐号,大多属于营销号范畴。

营销号是互联网垃圾信息的2.0升级版,当内容农场还在无脑搬运时,营销号已经精通“原创”垃圾信息的高科技了。

像是“开局一把刀,装备全靠捡”这种廉价页游广告,玩的就是一个“挂羊头卖狗肉”,这个套路就是营销号的制胜王牌。

500

“挂羊头”指的是特别唬人的标题和封面,早期经典套路是“震惊体”。其实很多媒体都喜欢用震惊体,毕竟人类的种族天赋是看热闹不嫌事大,谁不爱看大新闻呢?

但是2017年,有网友发现UC的文章标题高频使用“震惊!”这个开头,于是调侃他们是起了个“UC震惊部”,这才让震惊体成为流行套路。

500

后来的标题套路逐渐“谜语人”,比如“速看,再不看就晚了”,怎么的?我不看这篇文章,作者就要吹灯拔蜡吗?

在情绪价值当道的今天,标题套路也要输出强烈的情绪,像是“XX大厂,哭晕在厕所”“XX道歉了,但我不买账”,最好在封面图上给照片的眼部打码,更添一丝窥腥的爽感。

500

“卖狗肉”很好理解,正文内容简单直白兼具话题性,甚至无脑反智、造谣抹黑,复刻黄色新闻时代的“荣光”。

想识别营销号,其实很容易,从帐号名称、第一印象就能判断。必须说明,就算符合这些特征,也不一定100%是营销号,如有误伤,纯属活该。

首先从账号名称判断,“某人+某垂类”的组合是营销号的常用套路,什么“XX看球”“养生界XX”“XX八卦哥/姐”……。

500

完蛋,我又被包围了

如果是图文内容,只要看内容是不是空洞的车轱辘话就行。

视频更容易鉴定,开篇一句AI配音的“哈喽大家好,我是XXX,最近发生了一件很火的事情,我们一起来看看吧……”

然后用几秒钟展示一段已经严重包浆的144p竖屏短视频,结尾跟一段话术“这期视频到这里就结束了,小伙伴们有什么看法呢?在评论区留言,点个关注再走呀”。

500

好家伙,整个视频一共30秒,开头结尾的废话占了25秒。

如果BGM用的是久石让的《Summer》,听我的,朋友,快逃。

500

这群营销号批量制造信息垃圾,动力在哪里?因为真赚钱。

输出情绪价值的营销号,内容不需要列举证据、分析事实,只要捏着热点事件输出暴躁的情绪,广告费、打赏就来了。

卖账号也是不容小觑的赚钱方法,粉丝数量超过1000就有人买。短视频平台的千粉帐号能买到120元,万粉帐号300元。

配合一些自动抓取内容的工具,批量起号并不难,困难的是如何注册大量帐号。我们都知道,注册帐号需要实名认证。所以搞营销号的人,必须在非法渠道买卖身份信息。

这种需求催生出一条灰色产业链,很多不懂互联网、缺乏隐私保护意识的老年人,就被骗子偷走身份,成了营销号链条里的受害者。

只要花点成本搭建起自动化工作流,营销号就能躺着赚钱。

自动化营销号有多可怕?2019年有报道说,营销号“show娱娱”被曝光时上传了23万个视频,假如普通人一天做3个视频,需要连续213年才能做出23万个视频。

500

后来上传了30万个视频

不管产业再怎么升级,也跑不赢营销号的步伐。

也有人愿意跟营销号杠到底,像是旅游博主“太梓”,发现自己的原创内容被营销号盗用,成立“不要偷我知识产权服务有限公司”,三年内打了1000多场版权官司。

500

就像西西弗斯推石头,明知前方有无尽的阻碍,但从不放弃,荒诞同时值得尊敬。

03

提升垃圾内容的“品质”,全靠AI

最近有个神奇的社交软件Butterflies,在这里,AI才是本体,人类沦为工具人。

500

人类有什么用?打开软件、1分钟制作出AI角色,然后化身摄像头,欣赏AI们的丰富生活。

AI在做什么?疯狂发贴、发照片、转评赞,用996/007的强度享受赛博世界的美好生活。

在Butterflies里转一圈,有种牛马打工人围观财富自由人群吃喝玩乐的美

500

也有“务实”的AI在银河下敲代码,人家AI打工也能颇具情调

不怕AI玩得比自己花,就怕AI跑出它们的圈子,到人类世界里秀操作。

上个月,谷歌的AI成了全世界的乐子。搜索“批萨上的奶酪掉下来怎么办”,谷歌AI会说“涂上无毒胶水”。

如此离谱的回答,来源于Reddit的一篇上古老帖,帖子作者明显是在巨魔开玩笑,但被谷歌AI当真了。

更离谱的是,真有人买了无毒胶水,按照谷歌AI的配方做了批萨,而且吃了。

500

省流版本:味道很好,人还健在

谷歌AI犯傻之后,字节的豆包大模型也整了个活,有人发现能在搜索引擎里能找到豆包和用户之间的对话。

我们试着找当时的对话截图,但下手晚了,相关网页已经下架。

意外收获还是有的,“豆包 搜索引擎”这个关键词已经被SEO污染,点进去是一些卖奇怪器械的网站……

500

为什么当时能搜到豆包和用户的对话?当时豆包大模型默认勾选“允许分享内容被搜索引擎收录”,这才导致搜索引擎里全是豆包。

500

这个问题已经被修复

ChatGPT也有类似的功能,目标是方便用户分享内容。虽然豆包不是故意的,但网民们坐不住了,一股不安感涌上心头。

谷歌AI和豆包大模型的UI很明显,普通人能一眼识别,从而对它们的内容产生质疑。但有没有一种可能,AI生成的内容故意把自己伪装得人畜无害,故意混进我们的信息流里?

这种担忧,早已成真了。

基于Transformer架构的各种AI,最擅长一本正经胡说八道,简直是编写营销号的最佳工具。阅读这种工具生成的文字,感觉就像穿了冰丝内裤一样,丝滑流畅。

500

有人出售专门的营销号工具,也能一键生成视频

但你细品,就能发现一段几百字的小作文,其实毫无信息量,全是同义反复。见得多了,也就能大概猜出这是AI生成的内容。

实在分辨不出来,也有一些AI工具能辅助判断某段文字是不是AI生成。

AI正在判断AI生成的内容是不是AI生成,有点绕口令,而且挺魔幻的

更早以前,微信里就有很多疑似AI生成内容的公众号,它们似乎瞄准中老年人群,主打赛博飞升的胡言乱语。

像是“地球越级升级”这个号,简直是神幻的集大成,托尔金、乔治·马丁他们都不敢这么写。

节选一段内容给大家品品:

500

这类帐号下边,很多顶着中老年头像的人频繁打赏。

500

其实想想,挺失落的。以前的骗子虽然可恶,但他们毕竟是有血有肉的人啊。现在连骗子都进化成硅基生命了,这个世界人情味,真是一代不如一代。

AI强势逐渐入侵互联网,大型多人在线狼人杀即将开始。

更麻烦的是,玩狼人杀,我们能从玩家的面部表情里寻找蛛丝马迹。但AI“真人出镜”,真假难辨。

几天前,马斯克的深度伪造视频频繁出现在YouTube直播平台,伪·马斯克号称直播送比特币,诱导不明所以的吃瓜老外点击链接,到骗子网站里当韭菜。

500

刚刚过去的618电商促销,有一堆数字人直播带货,它们是真007,永远不需要休息。但毕竟技术有限,当你发弹幕跟它们互动的时候,就像卡壳了一样,过半分钟才能收到一个文不对题的回复。

这些数字人直播间刚刚上线的时候,成交额爆表,但没过几天,成交额就跌到真人直播的20%。人味,仍然是直播带货的必备要素。

500

"兄弟宇宙创始人"也加入数字分身的行列

经常关注科技内容的人,大概能判定哪些是AIGC。但对于大多数人来说,信以为真才是常态。

在2021年,“俄罗斯娜娜”和它的三姑六婆们集体攻占短视频平台。这些“伪人集团”操着塑料俄普,一口一个“中国的兄弟姐妹们,你们好”,疯狂带货赚钱。

其实它们根本不是俄罗斯人,而是100%原生态的本地老乡,利用AI换脸技术,把自己伪装成俄罗斯人的脸型,收割国人的爱国情怀。

500

“俄罗斯娜娜”的真身,其实是个男人

这种低级骗局能奏效,恰好说明大多数人分不清AIGC。

说了这么多AIGC的负面案例,好像AI都是洪水猛兽。其实不然,AI做好事的潜力无限大。

前几天看了一篇报道,一位医生发现网上有很多健康科普自媒体传播错误信息,但自己工作太忙,没时间一一纠正。

于是医生在一家数字人公司制作了“分身”,只需要确保文案准确,让“分身”出镜生成视频,极大提高传播正确医学科普的效率。

技术本身没有对错,有错的是想用技术作恶的人,以及背后的利益链条。

现在的互联网上,真实和虚假的信息混在一起,甚至虚假比真实更容易接受。不擦亮双眼,我们很容易陷入内容农场、营销号的泥潭里。

然而真实情况是,完蛋,我们已经被泥潭包围了。

全部专栏