北单实体店主

高阶数据:期望进球(xG),不知道就落伍啦!

北单实体店主微信:av616X4

【前言】

上期内容为大家介绍了基础的足球数据的定义,并结合实战记录解析了一些可能存在的问题。还没看过的小伙伴请移步

关于足球数据,你需要知道的这些事儿

在对于足球相关数据有了基本概念的基础上,接下来我们可以来看一看一些正在成为主流话题中的高阶数据名词,比如说,期望进球(Expected Goal/xG)。

【历史】

数据与统计的理念在体育比赛商业化后被广泛的应用在不同的项目之中,用以满足观众对于比赛不同维度信息的好奇心,以及提升球迷对于比赛的理解认知。棒球,被认为是最早引入体育数据这一概念的体育项目。1977年,比尔·詹姆斯以普通棒球球迷的身份开始撰写棒球年刊,也被看作是体育数据化的里程碑。随后,美国其他体育项目,如篮球,橄榄球,也分头开始各自项目的数据统计及发展。足球,尽管普及度更高,国际影响力更大,但在近年才开始慢慢赶上数据化体育的风潮。2012年,来自Opta的山姆·格林第一次引入期望进球(xG)的概念。十年荏苒,期望进球如今已是最为广大足球球迷熟知的高阶数据概念,越来越多的转播商(Sky Sports,BBC,ESPN)也逐渐将期望进球作为常规的足球内容。笔者希望通过这篇文章让广大球迷对于期望进球建立基本的理解,从而帮助大家更好的欣赏和理解足球比赛。

【概念】

一言以蔽之,期望进球(xG)就是一种通过计算特定位置和特定情境下进球的概率,来判定得分机会质量的数据。

进球是足球场上最重要的事,比对手多进一(几)球是判定胜利的唯一标准(看过上期内容的朋友清楚这里要加的的限定:除去乌龙)。在看球过程中,我们往往会因为前锋不早早推空门而爆出粗口,也会为了一粒精彩的“世界波”而瞠目结舌,放声庆祝。因为我们内心已经有了期望进球的概念:单刀空门推射 - 八成得进;40米开外的远射 - 这能进么?别这么踢啊…好球!!!不同的态度,代表了我们对于“机会”一词的主观理解。

(xG的基础模型,只考虑位置对于进球概率的影响)

因此,期望进球,与我们内心的标尺相比,就是以更科学的方法,加入更多客观的考量因素,更大体量的计算,来判断机会的好坏。这些客观的考量因素包括:

特定位置:与球门的角度,与球门的距离

特定情境:射门部位(脚,头…),防守压力,上一脚传球的类型(传中,身后直塞…)等等

就像其他数据一样,不同的数据商会有不同的模型,赋予不同条件以不同的侧重。但整体大同小异,期望进球都是以0 - 1之间的一个数字用来表示,1 代表球员必定会得分的机会,0 代表着不可能得分的机会。

如下图,布鲁诺·费尔南德斯获得的这次机会的期望进球数为0.3,意味着在这个区域类似的情况下,10脚射门预计可以打进3个进球。0.3这个数字是通过统计过去千百次类似的情况的结果得出的结论。这里我们需要注意,期望进球只用以评定射门前一瞬间的机会质量。换句话说,球员的射门能力并不作为期望进球的参考项。把下图中的B费换成笔者本人,期望进球仍然保持为0.3。

(B费获得门前机会,xG为0.3)

【进球概率 Goal Probability】

可能说到这里有人会问,那期望进球(xG)和进球概率(Goal Probability)有什么区别和联系?事实上,如果把两个概念放在如上图的情况下,二者并没有太大的区别:xG为0.3, Goal Probability是30%。只是从统计学的角度来讲,期望进球数是一个可以叠加的数字,而进球概率只能描述单一的机会质量。比如,以赛季为单位,B费的赛季期望进球为8.2,却没有对应的赛季进球概率。

【应用】

那么了解期望进球(xG)对于我们球员和球迷有什么帮助?接下来我们一起来看其两个主要的应用方向。

1. 帮助球员做出技战术层面的决定

天下足球足球广告_足球_足球即时比分

期望进球的模型可以帮助球员在场上做出正确的决定。比如,球场上的哪些位置有更高的得分概率,可以在概率高的位置多进行尝试,避免在机会渺茫的区域起脚。另一方面,期望进球也可以帮助球员理解怎样判断位置更好的队友,并在合适的时机进行多一脚传球的处理。如下图,巴列卡诺对阵皇马的比赛,维尼修斯获得单刀球的机会,此时如果起脚进行射门,那么进球的概率为31%,但维尼修斯选择横传找到了插上的本泽马,这一举动大大提高了这次进攻转化为进球的概率(至86%),皇马最终也得以凭借这粒迟来的进球 1:0带走了三分。

(上周末的联赛中皇马再次凭借维尼修斯和本泽马的连线得分)

相信看过这个实例之后,当我们自己在球场上遇到射门狂人时可以掏出这张图片,晓之以理动之以情,告诉对方,这球应该传。

2. 球员/球队分析

期望进球最大的用途还是用来辅助分析球员或者球队的技战术特点。通过对比球员之间的期望进球分布图,我们可以对于球员在一场比赛或者一个赛季中获得的射门机会有更直观的认识。

加布里埃尔·热苏斯和恰尔汗奥卢在2019-2020赛季都完成了100脚射门,然而热苏斯打进14球,恰尔汗奥卢“只”打进了8球。用传统的射门转化率来看热苏斯的效率明显大于恰尔汗奥卢,但球迷们心中都清楚这样的比较意义不大,毕竟前锋和中场的射门位置和终结难度大相径庭。期望进球则提供了一个更合理的对标单位:热苏斯平均每脚射门的期望进球为0.18,恰尔汗奥卢为0.07。由此我们可以看出两人在赛季中获得的机会质量是不能相提并论的。

(2019-2020赛季恰尔汗奥卢与热苏斯的期望进球对比)

对球员或球队一场比赛,一段时间,一个赛季的期望进球进行统计,我们可以对于球队在创造得分机会以及限制对手获得得分机会上有更全面的了解。如果一名球员能够稳定的保持着进球数大于期望进球数,那么我们就可以说这名球员拥有较强的机会把握能力。通过对比本泽马和维尔纳近四个赛季的净效率(净效率 = 进球数- 期望进球数),我们可以发现本泽马确实是更稳定,更高效的射手。净效率等于零代表着球员的平均水准,那么维尔纳有三个赛季的把握机会能力都低于预期。

(本泽马与维尔纳净效率对比)

特别鸣谢:EKOU原创漫画 提供的球员漫画形象图(微博:EKOU原创漫画)

除此之外如果在一场比赛中,一支球队的期望进球数远大于对手但却输掉了比赛,那很有可能这就是我们口中的“系统局” — 相信过程。在防守端,如果球队能把对手的期望进球数限制在一个很小的数字,那么也可以说明整场比赛的防守质量达到了一个很高的水平。

期望进球还可以用来评估球队在某一种特定情况下(如运动战/角球/定位球等)的表现。本赛季曼联在角球的表现中十分挣扎,前段时间刚刚由马奎尔在对阵利兹联的比赛中打入首例角球进球。通过对比联赛积分榜前四的角球数据我们可以发现,曼联通过角球的期望进球仅为3.1,证明了球队无法通过角球得分并不是偶然:球队缺乏通过角球创造得分机会的能力,并不仅是运气不好可以概括的。

【缺陷】

1. 统计因素不全面

很多人对期望进球的理念是排斥的,因为期望进球很多时候对于场上信息的反馈是不够准确的,更不是直接用来判断胜负的万能公式。足球充满着不确定性,也正是因为难以预料的因素和结果,才让这项运动拥有无与伦比的魅力。如下图所示,在上个月马竞对阵巴萨的比赛中,卡拉斯科为马竞首开记录,随后阿尔巴扳平比分。戏剧性的场面发生了,官方转播画面显示阿尔巴的世界波比卡拉斯科的准单刀球要更容易打进。这明显违背了我们对进球概率的主观判定,事实上,也一定程度上反应了期望进球和进球概率现阶段的计算问题。

(巴萨对阵马竞的两粒进球,期望进球数值有悖于观众的判断)

就这个例子来讲,笔者判断,有以下几种可能性导致了与观感相悖的结果。阿尔巴射门时身边没有防守人,而另一边阿劳霍距离卡拉斯科很近,可能西甲官方采用的模型对于防守队员施加压力的权重参考较重。另一种情况可能是西甲采用的模型不对左右脚球员进行区分,阿尔巴射门的位置实际上接近右脚球员的内切得分区域,所以可能有更多的进球拉高了整体的进球概率。不过这个例子在说明期望进球模型的缺陷的同时,也再次强调了xG的关键因素:不考虑是谁射门,只看类似情况的得分概率。

2.模型一致性低;缺少直观的应用价值

市面上有很多数据公司都有自己的期望进球的计算方式,由于计算的方式不同,得出的数字也会有很大的出入。因此,球迷朋友们在引用期望进球的数字来论证自己的观点时,切记他山之石,不可攻玉。条件允许的情况下,同样的话题尽量使用相同的数据源,避免产生错误的结论。除此之外,期望进球并不能直接用来判定球员的优劣和球队表现的好坏。不过大概所有的足球数据都是如此,需要球迷朋友们把这些概念放在情境下进行正确的应用。在之后的内容中,我们也会更详细的举例说明这些数据的正确应用和反面教材。

特别鸣谢:EKOU原创漫画(微博同名)

北单在那里买请加店主微信:av616X4