人工智能 频道

Rangers Redux:德克萨斯州能用数据、分析和人工智能重复成功吗?

  希望在开幕日永恒。每支球队都以完美的战绩开始,并梦想在六个月内赢得世界大赛。对于德克萨斯游骑兵队来说,捍卫他们的冠军需要努力工作、决心和运气的适当组合。哦,还有数据-很多很多数据。

  德克萨斯游骑兵队在场上和场外都努力工作,赢得了去年球队的第一次世界大赛。童子军花了数年时间寻找世界人才,前台人员调动,使球队处于季后赛的竞争中,球员们及时完成了比赛。运气也考虑到了,在季后赛中,在客场取得了闻所未闻的11连胜。

  那么,是什么最终将游骑兵队推向了顶峰?一种理论是,团队对数据、分析和人工智能的承诺和投资与此有关。在去年6月的数据+人工智能峰会上,游骑兵队研发助理总监Alexander Booth讨论了团队对Databricks数据平台的使用及其对人工智能(包括生成人工智能)的采用。

  在流浪者队赢得世界大赛后,Booth与Datanami坐下来,分享了2023赛季的一些经验教训,以及研发部门将如何改善其数据、分析和人工智能游戏,为2024赛季做准备。

  Booth在12月初的一次采访中说:“我们在研发部门的核心原则之一是,投资技术和投资数据使我们具有竞争优势。”“我们永远不想在追赶模式下追逐其他团队,特别是在技术和数据方面。”

  Booth将游骑兵对数据、分析和人工智能的使用描述为既非常激进和广阔,但也很平衡。该团队试图利用数据、分析和人工智能来优化尽可能多的决策,同时仍然为像经理Bruce Bochy这样的棒球生涯者的直觉留出空间。

  “显然,和像Bochy或CY[总经理Chris Young]这样的人在一起,他们在游戏中有很多领域专业知识。他们已经存在了一段时间,这超级有价值,”Booth说。“但归根结底,我们想做出决定。[无论是]关于调整我们防守位置的决定,我们是否将这家伙添加到名册中以保护他免受规则5选秀的影响,或者我们将在关键的季后赛中从谁开始——做出决定,特别是像这样的高杠杆决定,他们希望看到尽可能多的数据点。”

  Databricks平台、AWS计算和存储以及Prophecy等数据工具的组合使Rangers研发团队能够在一个地方积累大量数据进行分析和建模。他们如何处理数据取决于他们可以在哪些方面对游戏产生影响。

  游骑兵的数据、分析和人工智能系统的广度令人印象深刻,有许多不同的系统旨在为决策者提供信息。从跟踪业余水平的球员发展,使用基于物理的模型来微调防守定位,或运行模拟来优化投手-击球手的匹配,游骑兵队完全被数据、分析和人工智能所包围。

  以下是游骑兵队的一些数据、分析和人工智能系统:

  与GenAI一起侦察

  流浪者队是第一批采用生成性人工智能的MLB俱乐部之一,随着2022年底ChatGPT的推出,该俱乐部迅速成立,并于2023年席卷全球。

  Booth说:“你知道这是一场疯狂的技术革命,当这些只是生活和呼吸棒球的老球员在询问ChatGPT,以及我们如何以某种方式将其融入游骑兵队时。”

  侦察员使用的大部分信息都是非结构化的各种类型——侦察报告、报纸文章、视频采访。GenAI帮助游侠侦察员过滤噪音,并专注于重要的信息。

  “我和他们交谈,他们说'我做Ctrl-F'。他们有这些他们正在寻找的关键短语,”Booth说。“对于我们的利益相关者来说,他们正在阅读数十份侦察报告和文章,消耗大量关于这些球员的媒体,观看大量视频——很难挖掘噪音。”

  自然语言处理(NLP)也帮助游骑兵识别玩家本身的无形之处。通过将语音转文本功能与语言模型配对,他们可以快速处理许多视频,以了解大学或高中球员的心理构成,以及他们对逆境的反应如何。

  “这是棒球中经常发生的事情。你受伤了。你失败了。你度过了糟糕的一周。你有糟糕的两周。但你是怎么振作起来的呢?你如何努力让自己变得更好?”布斯说。“我们能够通过自然语言处理来识别某些关键短语和情感。”

  游骑兵队已经开发了自己的语言模型,知道棒球人是如何说话的。因此,当一个侦察员说“这家伙扔汽油”或“这家伙像卡车”这样的话时,模特知道这些都是积极的情绪。

  “因此,试图调整模型以适应自然语言的期望是一个需要解决的有趣问题,”Booth说,“但我认为我们在处理它方面做得很好。”

  玩家跟踪和生物力学数据

  棒球分析的最大革命之一是跟踪数据的广泛可用性。每个音调,每场比赛都以每秒30帧的速度精心跟踪,使用2023年推出的Hawk-Eye高帧率相机以每秒300帧的速度跟踪一些肢体运动。但并非每个团队在利用它的能力方面都是平等的。

  Booth说:“在棒球领域,这是新技术的爆炸性增长。”“我们获取这些数据已经有一段时间了,我们知道,如果没有云平台,我们将无法处理它。有些俱乐部无法直接处理它,他们无法拥有能够分析生物力学数据以获得优势的技术。因此,我们想建造一些耐未来和面向未来的东西。”

  对美国职业棒球大联盟团队来说,好消息是高中和大学现在也在投资更基本的每秒30帧跟踪技术。这增加了关于前景的生物力学数据量,所有这些都有助于像流浪者这样的美国职业棒球大联盟球队预测哪些球员在大联盟中有前途。

  Booth说:“归根结底,这就是我们正在做的事情。”“我们将有人工智能模型,预测这位高中或大学球员需要手术的可能性,预测这家伙将被接受的预期回合,预测奖金等事情。”

  天气数据

  另一个大量数据来源是天气。某一天风是吹进来还是吹出,将有助于为一系列场上的决定提供信息,例如使用哪种投球混合,如何组成击球顺序,以及外野手将在哪里比赛。

  球场如何受到天气的影响(图片来源:Statcast)

  “天气数据太疯狂了,”布斯说。“有很多数据进来,我们以前从未有过。流体动力学,基于物理的模型,预测球在不同大气条件下如何飞行,给定不同的风速,诸如此类。”

  科学说,吹向本垒板的风往往会放大破碎的球,这将影响投手可能使用的混合。当风吹向外场时,经理可能会倾向于投入大波普尔,或将他们提升到阵容中,希望得到本垒打。

  天气数据的可用性还有助于游骑兵队使球员和潜在球员的击球、投球和防守统计数据正常化。流浪者队在可伸缩的圆顶中比赛,这最大限度地减少了天气影响,但研发团队可以使用数据来查看球员或前景将在Globe Life Field中发布什么样的统计数据。

  Booth说:“如果我们真的没有技术堆栈来研究它,或者人、人工智能或产品,比如大规模处理的预言,我们就会被卡住。”“因此,制定战略,让我们成为天气数据的先行者,是优势。”

  季节性建模

  棒球一直是一场数字和统计的游戏。自大约20年前Moneyball时代开始以来,变化是团队用于分析的数据量,以及他们正在进行的分析类型。


  例如,游骑兵队使用机器学习和人工智能模型来帮助各种玩家开发决策,包括是否签署特定的自由球员。在2023赛季,球队有模型,试图预测各种自由球员投手会有什么样的赛季。

  Booth说:“我们有模特说,好吧,我们将在休赛期签下Jacob deGrom,现在让我们预测受伤的可能性。”“不幸的是,他本赛季确实在相当早的时候受伤了,但知道不确定性和概率论,这是我们当时愿意承担的风险。”

  在交易截止日期,流浪者队使用模型来预测投手乔丹·蒙哥马利和马克斯·舍泽的未来表现,权衡获得良好贡献的可能性与受伤的几率以及流浪者队的工资。Booth说,这些模型发挥了作用,但不是这些决定的唯一因素。

  Booth说:“这个决定并不是纯粹因为人工智能模型而做出的。”“这个决定是一个全面的、有组织的决定,CY确实有一种文化,他倾听每个人的意见,他真正了解了这种观点。”

  游戏建模和模拟

  流浪者队还积极使用建模和模拟,看看阵容或防守位置的变化如何帮助他们获胜。根据Booth的说法,它与流行的电子游戏MLB The Show没有太大区别。

  他说:“你可以插入一个阵容,看看比赛期间会发生什么,现在我想运行一万次。”“或者也许我想看看阵容的每一个可能的排列,看看什么会表现最好。”

  在投球方面,流浪者队有能力确定在某些情况下发生事情的几率,例如某个击球手是否可能在一击或两击中击中击球。“我们可以模拟出来,然后说,在多少情况下,那个滚地球发生了?它实际通过内场的概率是多少?他上垒或过来得分的概率有多大?”

  模拟与他们的人工智能模型携手合作,帮助游骑兵了解结果到底在说什么。

  Booth说:“许多传统的ML模型,真的很难理解其输出和预测的确定性。”“因此,将人工智能输出和建议与一些模拟输出相结合,为其中一些点预测和点估计提供了不确定性估计,这再次追溯到以下主题:信息越多,数据越多,你必须分析情况的技术和模型越多,你就越有信心在一天结束时对建议。”

0
相关文章