裸金属并非技术退化,而是云计算中的高端选择。它让客户自主快速变更配置,无需繁琐工单,体验远超传统租赁。大型互联网公司纷纷采用,证明其价值。裸金属与云主机、私有云各有优劣,适合追求稳定、独享资源或定制硬件的客户。
1. 裸金属受到的误解
外行朋友们一提到裸金属,多少带着误解和嘲笑。
第一反应,服务器租赁业务做了个改名包装,硬蹭云计算的热度。
第二反应,连虚拟化和动态迁移都没搞定,相比云主机就是技术退化。
第三反应,租赁裸金属的客户应该是人傻钱多和时代脱节。
但实际上各大云裸金属的业务规模逐年增大,甚至有赶超云主机的趋势。
确实有IDC公司蹭裸金属的热度,也有很多云按照“租赁服务器”或者“独享云主机”的方式做裸金属产品设计但遭遇失败,本文就是要解释裸金属拥有独立的产品价值,在第五节也给出了裸金属要有哪些功能,方便和服务器租赁做区分。
裸金属产品基于选型而非缺陷,才没有实现hypervisor,因此大量技术细节要明示给客户,且客户仍有网络和存储需求,其技术难度大于公有云主机,约等于私有云主机。
很多大型互联网公司都在租赁裸金属,他们应该不是人傻钱多和时代脱节,要没这些客户的选择,各大云裸金属业务不会逐年增大。

2. 裸金属和硬件租赁的区别
裸金属产品和硬件租赁的本质区别是,裸金属产品可以快速自动化的完成网络拓扑变化,进而让客户体验到产品快速交付。
没有云计算的时候,租赁服务器也不是主流业务形态,根本原因就是配置变动太难太琐碎了,客户租服务器还不如自购服务器使用方便。客户要变更租赁服务器,需要给租赁方下工单,由对方花一天时间进行人力操作,如果是批量操作服务器甚至需要半个月时间。因产权归租赁方所有,就算客户想跑到机房换硬盘拔网线都没这个权限。
裸金属产品是客户自主自动做配置变更,不涉及网络布线(有网络管理),也可以不关注硬盘(可以使用云盘或者要求客户自主重建本地盘),客户直接在控制台和API上就可以完成变更操作,变更结果反馈能控制在分钟级以内。
裸金属用户能快速做出配置变更和环境重建,这是客户体验和商业模式的质变。
租赁服务器双方有逻辑死结:维保服务器和变更配置越困难,双方越不想有任何变动;客户怕旧硬件故障多就只租新硬件,租赁厂商怕旧服务器砸在手里只敢签长租合同;厂商的服务和腾挪空间越少,客户越不愿意支付溢价。
对于裸金属用户,因为快速申请和释放资源,随时做出配置变更,客户并不锚定某一个具体的硬件了,用新用旧都一样,商业模式就从定期死租变成了灵活租赁。灵活租赁本就有资源运营收益,而且裸金属也有技术附加值,云厂商就有了产研投入的动力。

3. 裸金属和云主机的区别
裸金属和云主机在设计理念上就有个本质分歧,云平台要不要对计算环境进行管理调度和迁移,进而延伸出要不要云厂商做黑盒资源超卖,多租户是否会相互影响。
云主机可以代维护计算环境、资源复用导致单价成本低,云主机资源超卖和用户运营也有很大深挖价值,这是IaaS云发展迅速的重要原因。
另一些客户或者会耗尽所有计算资源,或者不想为节省IT支出做业务冒险,还有些计算环境就需要特配,通用云主机就是支撑不起来。这时客户就会选择裸金属放弃云主机。
客户选择裸金属,就代表可以接受单价偏高,愿意自主完成计算环境管理。高明的客户甚至因为充分利用资源最终总价偏低,因为维护能力超强最终计算环境更稳定。
云厂商选择裸金属,就没有腾挪超卖计算资源的手段了,那成交价格就坚挺一些,客户买裸金属之前就有成本预期,包括短租裸金属的空置成本。

4. 裸金属对比私有云
裸金属因为计算资源只给单个客户使用,很容和私有云弄混了。但我们实际分析就发现,裸金属和专属云的关系更近,和私有云关系较远。
相比于私有云,云厂商拥有裸金属产品的硬件产权和维护权,这让客户节省了大量的硬件维护精力,因为共用空闲资源池和备件库,公有云裸金属的弹性伸缩能力要强于私有云。
裸金属相比私有云的劣势就是前文的优势反过来分析,因为共用空闲资源池并不专属,裸金属在存储和网络层面也没私有云隔离的那么彻底。
5.裸金属的功能方向罗列
裸金属产品同样需要做技术攻坚,如果没有下列功能,裸金属产品就不完整,或者说是租赁服务器冒充裸金属,限于篇幅我只做一些方向罗列。
计算:快速自助装机,硬件驱动(含GPU和各种板卡),监控代理。
网络:内网高速互联(含IB和智能网卡)、Vlan隔离、多网卡管理,适度开放交换机接口或日志。
存储:分布式云硬盘、普通本地盘(含Raid管理),安全删除和快速迁移。
硬件:带外管理、硬件监控、批量上架和备机替换流程。

6. 裸金属的适用客户场景
裸金属产品受到的最后一个误解就是,客户是简单的“人傻钱多技能脱节”,但经过前文的铺垫再看客户场景需求已经很清晰明了了。
第一类客户,目标就是从合规和稳定的角度做独享资源隔离。
客户不需要云厂商从节省资源开销的角度,对其业务合规性和稳定性指手画脚。
专属专用型云主机并不向客户开放宿主机监控接口,在实操运营过程中仍然会出现和普通云主机混用混部的情况。
第二类客户,目标是低成本管理专属资源池,他们希望公有云厂商作为融资租赁垫资方和裸金属技术和服务供应商,避免采购要给云厂商预留毛利的云主机。
大互联网客户上云,年消费额数亿至数十亿的非CDN的案例,基本就是云厂商划定长租资源池+裸金属产品技术硬件维保服务,客户自己的技术团队再搭建简单功能云主机或者退化功能容器。这些客户也是计算机技术高手,他们的选择比云厂商更专业。
第三类用户,他们就是定制HPC、定制板卡、定制大数据群集等需求。
公有云主机很难做涉及硬件的定制,就算透传板卡也是透传通用板卡,但裸金属集群可以批量使用通用板卡。
大数据集群更是典型的例子,首先给一台云主机挂几十块盘就很滑稽,而且大数据本就是分布式存储加计算,计算节点挂本地硬盘比挂分布式云盘更合理一些。