推特“下云”后成本降低60%?是真的么

最近看到虎嗅一篇旧报道《
 “下云”后成本降低60%,马斯克的极限计划居然成功了?-虎嗅网
 [1]
 》,感觉这个结论有可能误导人,所以分析一下。

为什么twitter下云能节约成本?原因,第一是因为马斯克愿意承担风险,包括网站访问缓慢、业务不稳定、用户流失的风险。

马斯克刚刚接手推特,并且裁员70%的时候,推特的服务并不算稳定,经常有视频无法播放、信息流故障等问题,换了国内的互联网公司,早就全力整改了,还哪敢一边裁人一边从云上往线下迁移?

500

马斯克的决策有马斯克承担风险。但是世界只有一个马斯克。马斯克是怎么迁移机房的?他带着特斯拉的人而不是推特的人,连推特数据中心数据备份和迁移都没做,直接关机断电,然后找了搬家公司连机柜带服务器直接装车拉走,连防震防撞之类的保护都没认真做。

数据中心搬迁的风险,包括运输风险、硬盘损坏风险、数据丢失网线、网络无法恢复风险、设备无法启动的风险。到了新机房之后,重新再把设备卸车,接线上电,结果所有设备都正常启动了,数据也没丢,能承担风险的马总,还有一个好运气,不得不服。

但是为什么马斯克如此折腾推特的IT基础架构,而推特并没出什么大问题呢?因为推特一直以混合云的方式建设自己的IT基础设施,就是公有云和私有云相结合的基础设施。

在虎嗅这篇文章中已经提到了,马斯克既做了机房搬迁,又搞了云上转线下,这就已经证明推特既有线下数据中心,也有云上数据中心,所以推特是混合云模式的。

而且马斯克敢于把数据中心关停、移机,显然是因为还有云上还有可用的服务,线下数据中心承载的服务显然不是生死攸关的关键服务。

也幸好推特是混合云的架构,这样才能让推特有灵活机动调整的余地,具备足够的弹性,可以把部分服务从云上迅速转移到线下机房。

首先,企业应该上云还是下云,必须取决于企业的规模,认真去考虑人力成本、场地成本、设备成本、运维成本、时间成本,整体考虑投资回报率。比如字节跳动,之前一年要花几个亿在租用公有云上,这笔投资都足够打造一个云公司了,那字节跳动为什么每年还要花几个亿租机房呢?

原因有两个,一是因为字节跳动还在快速增长期,在用户量突飞猛进、广告费水涨船高的时候,IT部门完全没有必要强行把业务应用从云上迁到线下,要不然本来系统运行得好好的,突然之间宕机了怎么办,是不是耽误挣钱?

另一个是因为人性。一年几个亿的采购额,必然会产生一个利益一致的小团体,维持之前的云采购模式;要打破传统的采购模式,必须是在公司内极有威信的重量级人物才能推动变革。

后来字节跳动为什么开始自建机房了?因为大老板发现一年几个亿的钱投下去,还能再孵化出一条云业务线,也就是火山,这样在资本市场上就有更大的想象空间了——所以字节跳动不但开始从云上转到线下,还开始抢云上的生意了。

举个例子。前段时间运营项目管理平台basecamp的公司首席技术官,ruby on rails之父Hanson,也开始推动他们公司从云上转到线下,他说下云的行为已经给公司节省了100万美元。

basecamp是个小而美的公司,他的套餐定价是在12美元到149美元左右,所以它是给零零星星的小型项目管理团队来提供服务的。在2009年,他的用户数达到了300万人,但是他的员工规模是10个人。在2020年他有330万用户,但是利润非常高,人均年营收达到了330万美元。

这家公司只有这么一点点人,利润又高,那么花钱购买云服务,肯定是作为最节约人力成本、时间成本、机会成本的选择。否则的话要如果自建机房,那需要多少人来做运维和管理呢?

可是现在用户增长也差不多到顶了,每周大概会有几千个新注册用户。当增长放缓的时候,他们当然要考虑节流了。

basecamp的五年云服务租赁成本是多少呢?他们一开始每个月要支付18万美元,等于是126万人民币,五年的成本就是7560万,这个成本也接近了自建机房的分水岭。

他们之前在亚马逊上购买了各种各样的云服务,连存储都在云上,成本当然居高不下。当basecamp采用混合云架构部署之后,尽管成本从18万美元降到了8万美元,但是每个月还要花8万美元在云上。

而basecamp购买的物理服务器和自建机房,很有可能在未来成为负资产。随着AI的进一步爆发,传统的项目管理工具正在迎来AI助理时代,AI可以作为助手完成项目管理工作,basecamp如果没有成功完成AI转型,他们又如何维持现在的用户量级,维护当前的高利润率?

当公司面临市场萎缩的挑战时,如果你在使用云服务器,那么你只要迁移数据,并且关停服务即可,不用考虑残值设备折价回收,不用考虑机房房租水电成本;

而这些都是自建机房必须考虑的问题——当设备还没经历5年折旧,业务就先萎缩了,那该怎么办?

企业上云要买什么?

如果你是一家企业的IT负责人,应该如何快速用IT支撑企业业务?

如果你的公司是在起步阶段,员工数量还在200人以下的规模。那么把所有的服务全都放在云上,对你来说是最方便的选择。

一般来说,企业在云服务上主要用的就是服务器,存储,数据库,redis,kafka,nginx,然后配置各种各样的安全工具,比如防DDOS,以及漏洞扫描,云拔测等等工具。

云公司都会用一些优惠吸引用户,这个优惠不要白不要。因为云公司需要的就是你把主要业务上云,然后跟你做长线生意,因为如果业务稳定在云上了,迁移的机会成本会变得非常高昂,连想都不愿意想。

以前云上卖的最便宜的是云服务器,然后是oss云存储,卖的最贵的是云数据库,价格没有上限的是安全服务。但是最近阿里云大降价,云数据库的降价幅度超过90%,所以在中国,企业下云还真的未必能节约成本。

购买云服务器的话,只要两三分钟,一台装好系统、配置好关键组件的服务器就已经启动起来了,可见上云是多么方便。只要你的公司在持续发展,你的云需求就必然会越来越多,而且你也会习惯锁定一家云厂商去采购,这才叫长线生意。

当你买了云服务器之后,第一个问题就是云服务器硬盘比较小,你会希望扩容硬盘,这就是新增云需求,当你服务器买的多了,你要不要配个云存储啊?买了一个存储以后,是不是该考虑数据的安全性啊?是不是要考虑存储的备份以及主备冗余啊?

这时你有两个选择,一是在云端异地机房直接租一个云存储,一是你在本地机房搞个存储,用光纤连接云机房和本地机房。你会选哪个呢?选云上的就是纯公有云,选本地机房的就是混合云。

不差钱钱的公司会直接选择在云上再买一个,因为这样能够快速上线,操的心最少。你建立一个机房,招标采购加实施,最快也要3个月吧,而且消耗心力极大。

然后要考虑数据库了,你的服务器在云端,那数据库当然要放在云端。那你准备买主备数据库实例,还是买三副本的实例呢?数据库服务该买多大的cpu和内存?数据库存储要放多大?

数据库买完了以后,你是不是要考虑服务的稳定性,要不要上云拔测呢?你要不要考虑服务的安全性?万一有黑客攻击该怎么办?你是不是要买云厂商的安全服务?

安全服务可是一个无底洞,从最基础的抗DDOS攻击,到高端一点的漏洞扫描,威胁检测,威胁防护……只要你有钱,从5万块到100万都有相关的安全方案。

接下来,你有没有考虑流量洪峰的问题?你是直接留足冗余量,还是用弹性伸缩、容器化部署的方式来解决你的问题?

这里面的每一个需求,其实都有节约的优惠采购方式。比如没必要一下子购买高配置的云服务器,免得你的高端云服务器一直以1%的负载在安静的运行,那就是浪费。

记得微博经常因为某个明星宣告恋爱而崩掉,一旦服务卡了,哪怕程序员正在结婚,也要停下来先把这个故障处理掉,大家还记得这个段子吧?

后来微博就学乖了,一旦大明星可能有什么动静,微博就提前开始扩容。好笑的是记得有一次马蓉说要宣布大事,结果微博提前扩容了,后来马蓉的发布纯粹是个笑话,没有产生任何火花,微博白扩容了。

但如果微博没有放在云上,没法利用云计算的弹性伸缩机制来响应经常变动的业务需求,而是选择自建机房的话,微博的扩容有可能在几个小时内就完成么?

说一千道一万,企业上云是正确的选择。优惠的上云方式,应该是最小化的方式来去运行你的企业应用。在某个类似双十一的关键时间节点,可预见将遇到流量洪峰时,再提前去做弹性伸缩和扩容,这个才是合适的方案。

企业的行为决策,一定是从实际需求和实际现状出发的,在企业尚未做大,或者正在快速膨胀期,上云还是相对便捷、节约的选择。但是当企业人力充裕,技术得力,而云服务费用也超过分水岭,五年的云服务费用超过1亿人民币的时候,那就是租不如买的时候到了。

最后说个好笑的事,我也自建了混合云,云上是20M带宽、2C8G、100G存储的香港云服务器,线下是一台16核32线程、64G内存、5个万兆网口、四个PCIE接口、6个16T硬盘的Unraid NAS,用千兆宽带连接公网。

我自己的文件、数据库、Docker、网页应用全都用内网穿透的方式映射到公网上,响应足够快;总体拥有成本上,云服务器每年1000,五年租金5000;NAS是捡电子垃圾拼的,又买了6块拆机硬盘共96T,总价格9000。

如果我不是自建混合云,而是把所有应用都放在云端,存储也放在云端的话,一年30万怕是兜不住。

所以说,真正能降低成本的是混合云,把存储放到线下而非云上,才是经济的方式。

[1]

“下云”后成本降低60%,马斯克的极限计划居然成功了?-虎嗅网: https://m.huxiu.com/article/2236148.html

最近更新的专栏

全部专栏