年营收173亿美元的意法半导体,是全世界最重要的IoT芯片制造商之一,全世界每一台汽车,都用了他们的芯片,他们也是智慧城市和智能家庭设备的重要芯片供应商,提供了许多物联网应用需要的芯片。意法半导体很早就积极上云,2020年就开始用云计算ERP来管理供应链数据和预测需求。他们是第一波导入FOUCUS云计算费用标准的先行者企业,更有2名管理云计算费用的专人,也发展出自己一套FinOps实践做法。
为了推动上云,意法半导体有一个1千2百人规模的数字转型与信息技术部门(简称DTIT),这个部门下设有一个云计算卓越中心 (CCoE)。这是是一个虚拟团队,包含架构师、采购、法务、GDPR、财务控制等方面的成员,以及19位推动云计算实践的成员。
FinOps团队就是意法半导体云计算卓越中心下的其中一个小型虚拟团队,包含一位全职FinOps专员,另外有云计算架构师、安全架构师、基础设施架构师、工具与SLA监控专员和云计算运维人员则各自投入十分之一的工时来支持,整体FinOps人力约2人。
上云五年来,意法半导体也发展出一套自己的云计算成本管控的实践,意法半导体Finops总监Pierre-Emmanuel Nuiry归纳出6大原则,包括了团队必须协作、要用业务价值来驱动Finops决策、要让每一个人对自己的云计算使用来负责、要设立集中式团队来负责推动Finops、FinOps报表必须易访问且及时,最后还要能善用云计算成本善变的特性。
这位Finops团队负责人进一步解释,在团队协作上,意法半导体每月、每两个月或是每三个月,FinOps团队成员会和每一个将解决方案上云执行的团队举行会议,开会频率取决于每一个解决方案团队的上云成熟度。在这个定期会议中会审视所有的上云用量资讯和成本资讯,来讨论如何优化,也趁机改进方案团队的FinOps意识 。在这类FinOps会议中,意法半导体都会解决方案有关的不同职务的人员参与,尤其财管人员要参与。
第二项原则是要用上云的业务价值来驱动Finops决策,Nuiry解释,Finops做法并非“成本杀手”,而是努力平衡业务需求、服务等级协议 (SLA) 和最佳成本之间的拿捏,他指出:“我总是试图平衡业务的需求、业务要求的服务水平,并提出符合业务部门SLA的最佳成本解决方案。
“每个人都对其云计算使用负责”这是六大原则中,Nuiry认为最重要的一项,但要如何做到,他会提供每一个团队他们自己的季度成本预测,并创建一套可以关注、预测与实际摊销成本的KPI。要将100%的服务成本资讯,都提供给团队,最终由队自行决定想要采取的优化决策。
提供决策用的资讯也不能过时,尤其FinOps相关报表资讯必须及时而且容易访问,意法半导体利用BI工具制作即时报表,可以每日显示云计算成本的账务资讯,也能提供财务面和技术面的成本报告,可以按组织、解决方案、成本中心、环境来进行不同面向的成本分析。另外,还会针对管理层、解决方案团队、业务部门、工程师等不同角色的用户,提供各自的仪表板,方便他们查看。
意法半导体Finops总监所率领的团队是一个统一负责全集团FinOps的,这个团队要负责汇集整理各种优化、改善做法,“集中式FinOps团队的效益是,可以创造规模效益,也能集中资源强化宣传力道,来创建自己的一套工具和文化。”Nuiry指出。
像是Nuiry最常提醒各团队的一个观念是,要“善用云计算成本善变的模式”,像是要使用最新版本的虚拟机,因为这些虚拟机通常算力更强大、更便宜且更具可持续发展性。要善用不同价格的云计算服务,也要能够预测自己的用量,再根据业务需求进行调整,还要与财管部门沟通协调,像是要签署三年用量合约可以打折,但得与财务人员沟通。
不同上云成熟度的项目,意法半导体FinOps做法也会不同
若是新项目要导入FInops时,Nuiry会先与新团队召开会议,像他们介绍FinOps框架和相关支持团队。并且分享使用云计算资源时的命名惯例、推荐一些效益较佳的运算或数据库服务,也会提供一套成本评估范本给新项目团队。还特别要指导项目团队使用公有云企业的定价计算机,来估算自己按需付耗时的初始预算。在新项目Finsop启动会议中,Nuiry通常会建议,项目团队开始使用云计算资源后,至少先采取按需付费模式运行三个月,来进行性能调优,之后再针对实际用量进行财务角度或技术角度的优化做法。
若项目已经上云一段时间,FinOps关注的焦点就不一样了,“对持续上云的项目,异常用量侦测很重要。”他解释,由于许多项目团队的工作负载很大,除了大型项目外,团队成员很少有额外的时间,主动执行FinOps工作。所以,意法半导体FinOps团队会特别留意如何创建异常侦测机制,也从旁提供项目团队的顾问。像是提供工具,让团队方便每天快速检查成本趋势和意外偏差,也会设置自动告警机制。
Nuiry经常提醒几件事,要留预留虚拟机的使用率应该是0%,云计算成本突然飙升也得警觉。他会与应用程序团队进行深入研究,找出可能的补救措施或额外的优化方案 ,不过,他强调,最终的改善决定,要由项目团队来做,FinOps团队不会强迫他们去做任何决定。
为了维持FinOps文化的活跃度,意法半导体创建了一个内部FinOps网站来吉路各种最佳实践做法,例如虚拟机的自动停止和手动启动做法。他们也有一个云计算频道,定期发布最新FinOps和云计算使用资讯。并且定期举办FinOps实践、工具和技术的线上研讨会。尤其要表扬每一季的最佳FinOps表现者,不只颁奖还要公开再内部频道表扬,来激励团队。
意法半导体为了汇集整理各种云计算用量来进行云计算成本关注,也打造了一个FinOps数据搜集架构,必且导入了FOUCUS云计算费用标准,来统一这些云计算用量和成本的资讯。在这个架构中,通过Jenkins创建自动调度执行的任务,每六天执行一次,将过去六天,每一天各种项目所用的不同公有云资源的用量和费用资讯汇集整理压缩后,存到一个Blog云计算存储中,每天晚上会执行一个批处理来计算过去一年365天的数据,提供给BI工具,产生各种FinOps仪表板,也会发布原始FinOps以做他用。
Nuiry分享了几个特别有用的FinOps仪表板。一个是预测用财务仪表板,这个仪表板重视预测的准确性,会显示每一个应用程序的项目团队预测成本与实际摊销成本的比较,还会用百分比来凸显两者的偏差,并根据应用程序的成熟度设置不同的可接受偏差范围。
Nuiry指出:“偏差过大的团队将被要求重新规划做法,预测准确性与绩效奖金挂钩,若项目团队预估成本,是实际成本的95%到102%时,项目团队就能得到奖金。”意法半导体用这个方式来鼓励项目团队能够更准确的预估自己的用量。
另一个常用的仪表板是“节省金额仪表板”,这个仪表板会显示本年度从公有云企业收到的总发票金额,以及通过预留执行实例、节省计划和虚拟机停止或启动等措施所省下的金额。同时也会关注因为公有云未达到SLA契约要求,而获得公有云赔偿的退款金额。“这是管理层最赞赏的仪表板,每ㄧ季度都会找我们问最新的省钱进展。”Nuiry笑着说,意法半导体从2020年开始推动FinOps优化至今,已达到30~33%的云计算费用节省成效。
开发人员最喜欢的则是优化节省计划技术性仪表板,上面会以CPU小时用量为基本单位,来看不同云计算计价方式的成本变化,帮助项目团队判断,如何选择不同的云计算费用折扣方案。目标是在,保持足够按需容量来支持维护和升级的同时,也能善用不同云计算费用折扣方案的使用率。