午夜咖啡午夜咖啡

jolestar 的文章与笔记。

Post

云平台配额的可解释性问题

2021-03-30 21:18:10Post

平台治理一旦缺少清晰反馈,用户最后感受到的就不是规则,而是随机性。

吐槽一下这两天用某云的经历。

先是遇到了配额限制的问题,提示让提工单。

于是我提了一个工单,申请 32 核 64 G 的机器。响应也挺快,说配额修改了。结果创建的时候所在的那个区缺对应的资源,于是我就改成 4 核 8 G 的机器,心想着一个 8 个 4 核顶一个 32 核,总可以吧。结果提示配额还是不够,问客服,客服说这个配额是和机型以及可用区绑定的。好家伙,云服务不就是可以把资源拆开了卖么?这样和卖物理机有什么区别。

于是帮我新起了一个工单,申请 4 核 8 G 的机器。一通沟通,说旧区的资源不够了,给申请了一个新区的配额。我尝试了一下可以。看到有个自动伸缩的工具,心想着机器多,用自动伸缩管理下。自动伸缩配置好准备启动,结果一看又是配额不够。问客服,客服也很懵。

我看了一下配置,理解问题在哪里了,它这个自动伸缩设想的是在多个可用区自动伸缩,所以它要用哪个区是不确定的,而我只有一个可用区的配额,所以创建失败。客服这时候电话已经打过来了,我说了这情况,让他把第一个区的配额也给我开了。他说第一个区的资源不够,开不了那么多配额。我说,我只是开配额,又不用,自动伸缩会把我的机器放在有资源的区的吧。我们俩绕了一会圈子,最后我放弃了,好吧,咱不用自动伸缩了。

于是我去批量人肉创建机器,结果再次提示配额不够,不过这次提示的是我已经用了 xxx 台机器,但我没有啊..再次问客服,客服更懵。尝试了半天,删了些资源又退出重新登陆啥的,提示的机器数目算对上了。感觉是自动伸缩虽然失败了,但机器数给写到用户 session 里去了。

至此,我算彻底没脾气了,放弃了。客服态度很好,响应及时,比我还着急,动辄就电话过来,但就是解决不了问题,只是个传声筒,沟通全靠截图。

啥都要弄个人工审核的限额,导致产品功能之间互相掣肘,复杂的组合条件没法测试。这不仅是对用户不放心,对技术也没信心。