Kubernetes 集群 CPU 使用率只有 13% :这下大家该知道如何省钱了

作者 | THE STACK 译者 | 刘雅梦 策划 | Tina

根据 CAST AI 对 4000 个 Kubernetes 集群的分析,Kubernetes 集群通常只使用 13% 的 CPU 和平均 20% 的内存,这表明存在严重的过度配置。

在分析了 2023 年 1 月至 12 月期间在 AWS、Azure 和 GCP 管理的 Kubernetes 服务上运行的客户后,该公司在今天的一份报告中指出,优化可以为首席信息官们(CIO)节省一大笔钱。

(Gartner 预测,2024 年公有云服务的支出将达到 6780 亿美元,而 FinOps 的议程将继续上升,因此避免在云服务上超支是许多首席信息官(CIO)和首席技术官(CTO)的首要任务。通过 Kubernetes 优化可以节省大量成本。例如,人工智能公司 Anthropic 去年使用 Karpenter 将其 AWS 账单削减了 40%。)

另见:人工智能公司 Anthropic 通过使用 Karpenter 将其 AWS 账单削减了 40%。

对 CAST AI 联合创始人兼首席人才官(CPO)Laurent Gil 来说,调查结果表明,公司仍在“努力应对手动管理云原生基础设施的复杂性”——该公司的报告指出,在 Kubernetes 上,工作负载的大小是根据为 CPU 和内存设置的请求和限制来确定的:“优化它们就像走钢丝。”

“过度配置 CPU 和内存可以保持正常运行,但成本很高。”

“资源调配不足可能会导致 CPU 限制和内存不足,从而导致应用程序性能不佳甚至崩溃。当团队不完全了解其容器资源需求时,他们通常会谨慎行事,调配比所需更多的 CPU 和内存。”

“这就是自动化调整工作负载的用武之地。”他说到。(提供 Kubernetes 成本优化平台的 CAST AI 声称,开源替代方案为本已经很复杂的编排层增加了更多的配置复杂性,而其商业替代方案的即插即用功能是更简单的削减云支出的替代方案。)

另见:PlayStation 希望让游戏服务器在 Kubernetes 上运行。原因如下。

该报告的调查结果是基于 CAST AI 对 2023 年 1 月 1 日至 12 月 31 日期间在亚马逊网络服务(AWS)、谷歌云平台(GCP)和微软 Azure(Azure)上运行的 4000 个集群的分析,之后这些集群由该公司的自动化平台进行优化。

它进一步指出,对于包含 1000 到 30000 个 CPU 的大型集群,组织平均仅使用 17% 的预配 CPU。

简而言之,报告总结道,造成浪费的最大因素是:

  • 过度配置:分配给应用程序或系统的计算资源超过了其所需的数量。

  • 豪无根据的余量:对 CPU 数量的请求设置得太高。

  • Spot 实例使用率低:由于担心不稳定,许多公司不愿意使用 Spot 实例。

  • GKE 上“自定义实例大小”的使用率较低:除非自定义实例的选择是动态且自动化的,否则很难选择最佳的 CPU 和内存比率。完整的报告 在这里。

原文链接:

https://www.thestack.technology/kubernetes-clusters-are-typically-using-just-13-of-cpu-cios-could-save-a-fortune/

声明:本文为 InfoQ 翻译,未经许可禁止转载。

今日好文推荐

马斯克最新回应:OpenAI 的“邮件攻击”在说谎!斯诺登力挺:OpenAI 这么做是反人类!

砍掉百万行代码,这些巨头玩不转超级应用了?

4 秒处理 10 亿行数据!Go 语言的 9 大代码方案,一个比一个快

周鸿祎首堂AI课引争议,专业性错误遭质疑;智联招聘被“挤崩”,网友:找工作更焦虑了;马斯克起诉OpenAI,要求开源 | Q资讯

相关推荐

  • 用 AI Agent 治理微服务的复杂性问题|QCon
  • 苹果发布新编程语言 Pkl,国产配置语言如何应对?
  • 谷歌:不建议未成年人接触 C++,太过危险!Yann LeCun 和马斯克看到都笑了
  • AI巨头杨立昆的最新3小时访谈聊了些什么
  • AI代码加速器即将发布!傅盛:程序员会写某种代码就能找到工作的时代一去不复返了
  • ​前谷歌大佬离职创业,不到一年造出GPT3.5和Gemini Pro,惨痛忠告:GPU简直菜鸡,就像是买彩票!
  • ICLR 2024 | 单卡训练仅需1天!川大、北邮等提出多模态噪声关联学习
  • 北京/杭州内推 | 阿里通义实验室招聘大模型算法专家/研究型实习生
  • WWW 2024 | 简单却强大:揭秘Transformer在动态图建模中的魔法
  • Spring boot 集成netty实现websocket通信
  • 内推 |【B站】风控策略算法实习生
  • 央企大数据平台架构发展趋势与应用场景
  • 评选报名中!2024年最值得关注的AIGC企业&产品评选,有料你就来 🥇
  • 她才是赶奥特曼下台的关键人物?OpenAI CTO劲爆大瓜
  • 40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果
  • 她们正在影响AI进程
  • GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三
  • 懂AI PC的人要先拥抱新世界了 | 模力时代
  • 博士、博士后及研究助理招聘|港中文(深圳)贾奎教授,几何感知与智能实验室(Gorilla Lab)
  • 揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!