北单实体店主

关于足球,你的认知可能都是错的

北单实体店主微信:av616X4

此文属于《数字游戏:关于足球,你全弄错了……吗?》的读书笔记系列。

前言:挑战你的足球观念 (Soccer for Skeptics-The Counter(s)-Reformation)

足球作为依靠经验积累的领域,其传统观念既丰富多彩,又深入人心。这样的传统观念“定义”了足球应该怎么踢。

可是,传统观念真的都绝对正确的吗?

举一个例子:斯托克城一旦获得前场边线球,德拉普就会大力把球掷到禁区创造得分机会。可是,为什么斯托克城会采用这一战术呢?

答案很简单:数据显示,掷边线球到禁区的战术创造了斯托克城当季三分之一的进球机会。这一战术对于斯托克城来说是非常有效的得分手段。

可是问题来了,如果这一战术这么有用的话,为什么其他队不用呢?如果是因为没有德拉普这样臂力惊人的球员的话,那为什么不去寻找一个,或者训练一个这样的球员呢?更根本性的问题是,到底是用这一战术好,还是不用这一战术好?

(注:这一系列问题都是寻求因果关系。)

这本书所有的内容都在试图挑战固有的足球传统观念。全书尝试回答以下两个问题:

挑战传统所运用的技术手段是数据分析。数据,作为更为客观的事实载体,可以为我们揭示更多的真相。数据分析的结果也许会证实一些传统观念是正确的,同时也会否认一些传统观念,这就为一种更好的足球指明了方向。

足球数据分析现状

1990年代,Opta Sports开始用数据指标来评价球员在比赛中的表现。

刚开始的时候,记录每场比赛的事件大约需要四个小时。一支笔,一张纸,然后就是不停按录像机的开始/停止键。记录的事件类型也很基础:传球、射门和扑救。现在,他们记录的事件类型已经远远不止这三种。2010年欧冠决赛拜仁对阵国际米兰,Opta的分析人员一晚上录入了2842个事件,差不多每两秒钟就要录入一个。一个记录员负责记录拜仁的数据,另一个记录员负责记录国米的数据,同时还有一个人负责监视、纠错和查漏补缺。

Prozone是另一家数据公司,他们提供数据来帮助教练指导球员,以及帮助俱乐部寻找合适的球员。2011年夏天Prozone与法国数据公司Amisco合并。这家公司会在球场上方架设摄像头跟踪每一个球员,搜集数据。

其他数据公司:德国的Impire,荷兰的Inforstrada,美国的Match Analysis和StatDNA……

足球即时比分_天下足球足球广告_足球

足球数据分析前身

英国人Charles Reep的故事。从1950年3月18号开始,Charles Reep手工记录了超过2200场比赛的数据。他记录的是比赛中各种与球相关的事件,比如传球、传中以及射门。他的一些发现:

一支球队平均每九脚射门可以打进一球。所以他认为足球是一个随机过程,九脚射门进一球,但是哪一次射门可以进球是随机的。传球成功率则跟掷硬币差不多:50%。足球比赛频繁地交换球权:绝大多数的连续传球不会超过1脚,91.5%的连续传球不会超过三脚。在对方禁区内抢得皮球,30%会形成射门机会并射在门框范围内。一半的进球都源于这种形式的进攻。

2011年夏天,利物浦签下唐宁和亨德森的时候,其中一个重要的原因就是看中了他们的“进攻三区抢回球权比率”。这一指标与Charles Reep的第三点发现相对应。此外,巴塞罗那和西班牙的高压战术(pressing game)也对应于第三点发现。

然而,Charles Reep却发展出了不一样的足球理论。数据显示,只有2/9的进球来自于超过三脚传球的进攻,一支球队平均每九脚射门可以进一球,所有进球的一半都来自于在对方禁区内的反抢。因此Charles Reep断定一支球队不需要花很多时间去倒脚,而应该更快速有效地把皮球运转到对方禁区。他的结论就是多打长传球(long ball game)。Charles Reep的结论也影响了英式足球的风格。

现在我们知道,这种长传球的打法并没有为英格兰赢得冠军,也没有成为世界足球的主流。书中指出,Charles Reep的理论失败在于他对待数据的态度不正确。Charles Reep是先于数据就有了自己的观念,然后用数据去验证这一观念。然而正确的态度应该是,首先放弃既有观念,看数据能告诉我们什么有用的信息,从而改变我们思考足球的方式。

(注:个人并不完全认同书中的这一观点。改变现有足球传统观念有两种方式。一种是对现有的观念进行局部的修正和优化。数据分析所能提供的主要就是这种方式,而使用的态度就像书中提到的那样:首先放弃观念,看数据能告诉我们什么有用的信息,从而来改变我们思考足球的方式。这是一种微调。另一种方式是建立一种全新的足球思维模式,从根本上对现有足球观念进行变革。这是一种大修。数据分析恐怕很难满足这种方式,因为这种方式涉及到建立因果关系,而数据分析通常所揭示的都只是相关关系。比如,Charles Reep发现的都是相关关系,而相关关系是可能改变的,因此基于相关关系无法形成一个可靠的理论。)

使用数据分析改变传统观念——举例

传统观念1:进球后的那段时间最容易丢球

City University London的学者Peter Ayton和Anna Braennberg分析了127场以1-1结束的英超比赛,记录了第一个进球和扳平比分进球的时间。他们把第一个进球后的比赛等分成了四份。结果发现,在进球后的第一个四分之一比赛时间中其实最不容易丢球,而不是最容易丢球。

传统观念2:角球很有用

角球并没有什么用。数据确实也显示,角球和射正次数确实是正相关的:射门次数越多,获得的角球就越多。反之亦如此。但是,射门次数角球次数多并不意味着更多的进球。一支球队的进球数并没有随着角球的增多而增多。事实上两者的相关性是零。通过检验2010/2011赛季的134场英超联赛的角球数据(1343个角球)发现:20.5%的角球转化成了射正球门数。1/9的射正球门的攻门最终转化成了进球。这意味着,一个角球平均来说等于(0.205×1/9)0.022个进球。(注:这等同于平均50个角球进一球。假设一场比赛平均5个角球,那么每10场比赛才会有看到一个角球进球。)

PS:

每周六定期更新足球数据分析书籍的个人读书笔记。若是对足球数据分析感兴趣,却又无法抽出太多的时间来阅读相关书籍,你可以先阅读本专栏的读书笔记。如果想进一步了解足球数据分析,建议你再阅读书籍,并做好自己的笔记。

第一本书从这里开始:《数字游戏:关于足球,你全弄错了……吗?》(The Numbers Game: Why Everything You Know About Soccer Is Wrong)。此读书笔记针对该书的英文版。

北单在那里买请加店主微信:av616X4