人工智能 频道

用生成性人工智能驯服多云混乱的7种方法

  Devops团队正在与人工智能副驾驶和代理合作,以管理多云复杂性。以下是genAI可以改善多雲採用、治理、可觀察性等的七種方法。

  在单一云基础设施上实现标准化比追求多云战略要容易得多。在单云环境中,IT领导者可以优化技能组合,更轻松地集中数据,用更少的工具保护基础设施,并获得许多其他运营优势。然而,89%的企业报告说,他们正在转向采用多云。选择跨多个云运行的原因包括降低风险、减少服务中断以及避免供应商锁定。

  供应商通过跨云提供商运行的“单窗玻璃”工具应对了多云的复杂性。例如,AIOps平台可以集中可观察性和数据监控,而许多数据安全态势管理(DSPM)平台是多云的。建立平台工程实践,将finops作为关键架构实践,以及自动化CI/CD部署是devops团队在管理多个云时减少开销的三种方式。

  生成性人工智能工具,包括人工智能副驾驶和人工智能代理,也正在变得无价之宝。世界级的IT部门正在使用genAI来编写敏捷要求、开发软件、自动化测试和维护文档。

  我问了IT领导者,他们如何使用生成性人工智能来提高多云架构中的效率和简化复杂性管理。

  1.评估云服务和代码可移植性

  建筑师很难理解专有云服务和跨云平台之间的权衡。例如,开发人员是否应该使用AWS Glue、Azure Data Factory或Google Cloud Data Fusion在各自的平台上开发数据管道,还是应该采用跨云工作的adata集成平台?

  生成式人工智能为代码创建和翻译的第三个选项打开了大门。考虑开发人员在开发期间编写代码,为一个云提取、转换和加载(ETL),然后如果架构发生变化,则过渡到另一个云提供商。

  “管理多云就像从AWS、Azure、Oracle等学习多种语言,很少有团队能够流畅有效地穿越这些环境。此外,服务和概念在云中无法移植,特别是在超越IaaS的云原生PaaS服务中,”FluidCloud的联合创始人兼首席技术官Harshit Omar说。

  解决这个问题的一个方法是指派一个人工智能代理来支持开发人员或架构师评估平台选择。这位人工智能代理将审查标准、决策标准和要求,以建议解决方案并明确权衡。

  Omar说:“GenAI可以像devops副驾驶一样提供帮助,了解用户的意图和设计偏好,无论目标是优化成本、性能还是安全性,并自动生成正确的基础设施模式。“团队花更少的时间寻找多云语言学家,而有更多的时间执行基础设施更新和优化工作负载,以寻找最适合其业务的环境。”

  建议:跨云移植对于简单的配置和实现来说将是一个更现实的选择。使用云架构代理和代码翻译人工智能工具可以帮助实现多云可移植性。

  2.从编码转向提高弹性

  使用genAI工具,开发API、应用程序和数据管道变得越来越容易。根据《2025年人工智能代码质量状况》报告,82%的开发人员每天或每周使用人工智能编码工具,70%的开发人员报告提高了代码质量。自动化帮助IT将努力转向左转,专注于客户体验和提高数据质量,而代码生成器可以帮助他们转向右转向提高运营弹性。

  Appfire首席技術官Ed Frederici說:「GenAI正在創造一套新的技能,其中知識工作者透過提示和規範學習編碼,而AI則處理特定於云的機制。」“在未来,衡量成功的真正标准不仅是成本节约,而且是弹性系统、更强大的治理和授权团队,这些团队将人工智能理解为工具集,而不是每个云的怪癖,帮助他们以更大的信心和影响力工作。”

  建议:GenAI可以通过将治理政策转化为特定于云的实现来提高弹性。

  3.根据标准要求创建多云配置

  跨不同云的基础设施和服务配置标准化需要不同命名惯例、架构、工具、API和其他范式方面的专业知识。寻找genAI工具作为翻译来简化配置,特别是对于能够模板化其要求的组织。

  Dataiku的人工智能架构主管Jed Dougherty表示,管理多个云可能是一种挫折,因为每个云都有自己的安全、访问、定价和服务方法。Dougherty预计genAI将简化翻译过程:“想象一下,genAI将复杂的AWS IAM角色自动转换为Azure角色定义,或将AWS CloudFormation模板转换为谷歌部署管理器配置。”

  建议:寻找genAI工具,从一组要求中构建自动化和云配置,并转化为特定于云的实现。

  4.简化操作和自动化

  CI/CD、基础设施即代码和流程自动化是提高效率的关键工具,特别是当任务跨越多个云环境时。其中許多工具使用基本流程和規則來簡化任務或編排操作,這可能會產生導致流程阻塞錯誤的邊界案例。将genAI添加到这些自动化中可以实现更强大的自动化,并扩大其适用性。

  Hexaware的高级副總裁兼全球人工智能主管Mehdi Goodarzi表示:「管理多云环境传统上很複雜,需要多种工具來進行編排、合規性和成本控制。“GenAI现在通过在生态系统中引入自动化、上下文洞察和智能治理来改变这一点。它简化了可见性,主动解决性能和安全问题,并无缝地协调跨提供商的工作负载。这一演变共同将多云从资源密集型的必要性转变为敏捷性、弹性和业务增长的强大推动者。”

  建议:寻找在流程和错误处理中提供推荐操作的genAI功能。然后,Devops可以生成风险和准确性分数,以帮助决定哪些操作需要自动化,哪些需要人工干预。

  5.通过genAI可观察性提高问题解决率

  站点可靠性工程师(SRE)需要在停电或性能问题期间进行绩效,但他们更喜欢审查系统性能,并在问题出现之前主动向开发人员提出改进建议。提高应用程序的可观察性有助于SRE,但它也带来了数据管理挑战。

  SurrealDB的联合创始人兼首席执行官Tobie Morgan Hitchcock说:“多云混乱从根本上说,这是一个数据问题,genAI的边缘正在在配置、日志、模式和血统上建立一个统一的语义层。”“自然语言SRE副驾驶将推断拓扑、数据重力、合规性和成本,以提出位置,生成运行手册,并持续补救云层漂移。”

  不一致和不标准化的可观察性数据可能会导致误报和误诊。但回到开发团队去遵守数据标准和命名惯例是有代价的。

  CloudBolt的CPTO Kyle Campos说:“今天的多云运营让团队不知所措,因为嘈杂、断开连接的警报掩盖了真正的问题。”“GenAI通过解释复杂的跨云遥测,并仅显示具有有意义的上下文的高价值事件和优化机会来改变这一点。结果包括减少警报疲劳、更快的分辨率和可衡量的第二天运营影响的提升——这是企业如何跨云构建、管理和持续优化的关键一步。”

  建议:SRE应花时间测试人工智能代理和其他genAI功能,这些功能简化和加速了可观察性数据的使用,以提高应用程序性能。

  6.缩小政策和合规性之间的差距

  每个云提供商都有自己的工具来实施政策和审查合规性。当这些政策更新时,安全和运营团队必须逐一更新他们的实施,这效率低下。

  Commvault首席技术和人工智能官Pranay Ahlawat说:“企业将AWS、Azure和GCP的三个不同堆栈拼接在一起,导致运营复杂性上升、脆弱的跨云集成以及数据重力、出口和持续技能短缺驱动的成本阻力。”“GenAI可以自动生成便携式IaC/政策,将意图转化为原生控制,并补救跨云的漂移,这可以改善合规性和成本态势。”

  建议:受监管的企业将需要合规和安全工具,这些工具能够一次性实施政策,然后跨云功能进行部署和报告。在这些工具中查找genAI功能,以支持报告和配置。

  7.启用连续的finops监控

  带有建议的云成本报告在每个云提供商的报告工具和汇总相关数据的专用finops工具中原生提供。具有重大可变成本的组织,特别是当他们扩展人工智能程序时,需要的不仅仅是报告来持续优化成本和工作量。

  Vultr的首席营销官Kevin Cochrane说:“传统上,组织很难在多个云中监控、配置和优化工作负载,因为他们兼顾了不同的API、工具和成本。”“GenAI通过跨环境提供智能建议、预测性扩展和自动策略执行来简化这一点。这减少了运营开销,最大限度地减少了配置错误,并确保工作负载高效且具有成本效益地运行,使团队能够专注于人工智能创新,而不是管理复杂性。”

  建议:较小的组织应将审查云成本的责任分配给Azure Advisor、Google Cloud Recommender和AWS Cost Explorer等工具。大型组织应审查为金融和工程最终用户设计的finops工具中的genAI功能。

  genAI能完全解决多云的复杂性吗?

  GenAI目前嵌入到开发和运营工具中,但它不是的。关于多云,Comvault的Ahlawat表示,genAI並沒有消除数据重力、延迟、承诺或人才缺口等结构性限制。他说:「组织仍然需要强大的护栏和平台工程来管理整体运营复杂性。”

  我们还可以期待公共云发布额外的差异化功能,因此即使由genAI提供支持的工具简化了当今的挑战,新的挑战也会出现。

0
相关文章