随着企业争相扩展人工智能规模,它们正在无意中加剧一场业已存在的数据危机。由此引发的遥测数据激增,让那些本就因多云环境、应用爆炸和物联网设备普及而绷紧神经的基础设施不堪重负,直接推动了成本的急剧膨胀。如今,许多组织仍在为收集、存储和处理那些几乎不产生商业价值的海量日志数据支付巨额账单。
数据显示,高达66%的企业经常遇到与可观测性工具相关的意外成本或预算超支,而95%的企业已积极采取措施来降低可观测性成本。压力显而易见。但削减成本只是挑战的一部分;企业还需要以前所未有的速度和灵活性来移动数据。
现代应用依赖于源源不断的数据流才能正常运行。系统之间必须实时通信,每天产生TB级别的流量。如今,人工智能和机器学习正在彻底改变企业对这些流程的管理方式,要求信息能够在不同的云环境、分析工具和AI框架之间实现无缝、即时的流动。
盲目为失控的数据付费的时代已经结束。为了在不超支的前提下最大化数据管道的价值,企业正纷纷转向OpenTelemetry,以求重新掌握主动权。
可观测性的“隐藏税”
企业若想收回预算,首先必须解决效率低下的问题——这是许多DevOps团队面临的可观测性“隐藏税”。现状是,每个组织几乎都在从零开始重建相同的数据管道。由于配置缺乏标准化,工程师们无法从彼此的经验中学习,实际上相当于数千个团队在重复着同样的试错过程。
这种重复努力造成了时间和资源的巨大浪费。手动配置收集器、处理器和导出器通常需要数周时间,还要耗费无数小时去解决连接问题。然而,这种复杂性,很可能已经有成千上万的其他组织成功解决了。许多团队却对此一无所知,他们苦苦摸索的优秀实践,其实早就在行业内其他地方得到了完善。
一些企业可能会选择专有供应商来应对这种复杂性,但引入第三方解决方案往往只会让问题恶化。这些工具虽然承诺提供更好的数据管理和更低的存储成本,但随之而来的供应商锁定,通常会造成额外的长期挑战。一旦数据被锁定在某个专有供应商的方案中,未来迁移到新平台将变得既复杂又昂贵。因此,当业务需求变化需要转移时,企业常常发现自己受制于现有的供应商关系,除非对数据管道进行大规模返工,否则无法顺利转向。
冗余带来的沉重代价
以低效的方式处理海量数据,还会进一步推高组织的成本,让原本想解决的问题变得更糟。许多组织使用多种不同的工具和代理进行数据收集,这要求团队具备跨越数据工程、安全、机器学习等分布式系统的专业知识。在各自为政的孤岛中管理这些系统,会给人力资源带来额外压力,通常意味着需要增加人员配备或进行专业培训,所有这些都加重了财务负担和时间限制。
如果数据工程师陷入无休止的试错循环来管理海量遥测数据,那么组织就只是在被动地从消防水管里喝水,而不是以有目标的方式主动管理数据。在一个AI需要即时访问大量数据的时代,这种僵化将成为致命的竞争劣势。如果企业想在AI驱动的世界中取得成功,其数据基础设施必须能够在不牺牲成本效益的前提下,处理快速流动的数据。
企业若想将数据从负债转变为资产,识别并减轻这些隐藏的挑战和成本势在必行。
利用OpenTelemetry收回预算与控制权
希望最大化数据价值的企业,正纷纷转向像OpenTelemetry(简称OTel)这样的开源框架。通过在OTel之上构建数据管道,企业可以确保自身的灵活性和与供应商的无关性,从而能够随着业务需求的变化而即时调整方向。
OTel是一个标准化的框架,它极大地简化了跨各种编程语言和操作系统的遥测数据收集与处理。通过消除对多个专有工具的需求,OTel降低了大规模管理遥测数据的复杂性和运营成本。
OTel还汇集了全球领先组织中顶尖数据工程师的集体智慧,共同解决核心的运维挑战,使企业能够访问一个由业内优秀实践构建和完善的统一框架。通过提供标准化的方法,OTel显著缩短了管道实施过程中的学习曲线,减少了试错环节,从根本上消除了重复劳动。此外,该框架依托全球社区的支持,持续更新,不断提升其内置的合规性与安全性,以应对CIO和工程团队在构建面向未来的数据基础设施时遇到的日常挑战。
通过这种方式,企业能够以更具成本效益的方式获得更优质的数据洞察。但最终,真正的力量来自于OTel的适应性,它让企业能够持续改进。
为了成功地在OpenTelemetry上构建数据管道,企业应实践以下三种方法:
● 部署OTel Collector: 在使用OpenTelemetry创建遥测管道时,企业需要设置一个兼容OpenTelemetry的Collector作为核心处理单元。这个Collector负责汇集来自不同来源的数据,对其进行处理或转换,并将其发送到正确的目的地。通过在管道内部转换和丰富数据,组织的系统将变得更加互操作和灵活。
● 实施集中管理: 集中管理将所有遥测代理及其配置整合到一个统一的界面,使组织能更好地掌控其可观测性设置,同时简化运维,并降低管理分散遥测系统的成本。这也有助于组织快速发现和定位问题,减少维护管道所需的人力,并降低配置错误的概率。OpenTelemetry支持通过OpAmp等协议实现集中管理,从而能够远程配置和监控遥测代理。
● 进行智能数据过滤: 组织必须善于利用OTel框架内提供的工具,有选择性地过滤数据,并将价值较低的数据路由到低成本存储中。这一策略能有效降低存储和处理成本,同时提升对关键数据的可见性,使分析工作更快、更高效。
通过更智能的管道消除“可观测性税”
将数据管道迁移到OTel,不仅能让企业降低成本、加快数据处理速度,还能让他们以更智能的方式处理正在收集的遥测数据。
在AI快速发展的复杂IT环境中,组织必须具备随着需求变化而实时调整数据基础设施的能力,而无需进行传统上那种耗时的手动清理。使用OTel简化了数据摄取流程,增强了数据分发能力,并提供了随需而变的灵活性,帮助组织为构建具备运营弹性的可观测性体系做好万全准备。
当组织重新获得对其数据管道的完全控制权时,他们便能构建起竞争优势。向社区驱动的开源平台的转变,确保了企业能够摆脱供应商锁定的束缚,并为扩展规模以及无缝采用人工智能等新技术打下坚实基础——这一切都无需昂贵的返工,也不会让DevOps团队淹没在无用的遥测噪音之中。