很久没写干货了,今天给大家来点干货。
通过这篇回答帮助大家认识一下足球比赛中数据应用的前世今生,以及当下足球比赛中的数据采集和数据分析及应用。
足球数据分析起源于上世界50年代,而第一个将数据统计分析应用到足球比赛中的人叫查尔斯·瑞普,他也被称为是“足坛第一个数据分析师”。
查尔斯·瑞普出生于1904年,从普利茅斯高中毕业之后参加了会计师培训,然后在1928年参加了新成立的英国皇家空军会计部门的考试并且获得了第一名,从而加入了英国皇家空军,并于1955年退休。
瑞普是普利茅斯的狂热球迷,在服役于英国皇家空军期间,他就参加过很多足球战术的讲座。1950年3月,瑞普在观看一场斯文登的主场比赛时,他对那种过于缓慢的比赛节奏和被战术边缘化的边锋感到失望,然后在看着主队上半场徒劳无功地进攻表现之后后,他决定在下半场记录笔记。
此后,他经常会出现在各种足球比赛的现场记录笔记,通过分析之后他推断,当时一支球队平均每场比赛能够打进2球,但是只需要在机会转化率方面有小幅改善,就能将进球数提升到3个。
他的分析在当时引起了布伦特福德经理杰基·吉本斯的注意,从1951年2月到赛季结束,他以兼职顾问的身份受雇于布伦特福德俱乐部。当时联赛还剩下14场比赛,布伦特福德还有降级的危险,但在瑞普到来之后,布伦特福德的场均进球数从1.5提升到了3个,并且他们拿到了之后28个积分中的20分,联赛排名从第16升到了第9。
之后,瑞普在《新闻纪事报》上分享了他的分析成果。他得出结论称,大多数进球都是在不到三次传球的情况下进的,因此,他提出“尽快将球传向对方球门是很重要的”。越快将球传向对方球门,传球次数越少,进球就越多。他的这一理论后来被称为“长传战术”。
后来,瑞普又进一步提出,在靠近对手球门的地方赢得球权要比在自己半场开始的复杂传球动作能够导致更多进球,所以应该迅速将球传向前场,如果失去球权,就要努力迅速夺回球权。这是不是有点像现在的“高位逼抢”。
瑞普详细记录和分析的一场比赛是1953年在温布利进行的“世纪之战”——英格兰对匈牙利。当时的匈牙利已经拿到了1952年赫尔辛基奥运会的足球比赛金牌,并且保持着连续31场不败,目标直指1954年世界杯的冠军。最终那场比赛,匈牙利6-3大胜英格兰。
正如瑞普在之前分析中所指出的那样,匈牙利有4个进球都是来自于在靠近英格兰球门的地方夺回球权之后完成的。尽管对比赛结果大感失望,但是他觉得自己的分析得到了证明,但他并不知道的是当时的匈牙利足协也一直在分析足球,特别是优化射门位置,已有长达20多年之久。当时的匈牙利主帅古斯塔夫·塞贝什保存了关于阵型和战术的详细笔记,而匈牙利足协则保存了有关比赛和训练数据的文件,旨在帮助球队达到最佳状态。
在那场惨痛的失利之后,英格兰足协也开始努力寻找对足球的新见解,并且开始大量的记录足球比赛的数据。到了50年代末期,英格兰足协经常会在一场比赛中派出几十名数据分析师,疯狂地用铅笔和记事本记录比赛数据。
而查尔斯·瑞普在布伦特福德的出色工作也引起了当时的英格兰强队米尔沃尔的注意,并且邀请他加入球队做数据分析师。1954年4月24日,米尔沃尔以2-0击败托特纳姆热刺加冕联赛冠军时,瑞普的工作再次得到了证明。在球队的庆功宴上,米尔沃尔的球队经理卡利斯特意感谢了他们的分析师查尔斯·瑞普。之后,米尔沃尔又在1958年和1959年两度赢得了联赛冠军。
之后查尔斯·瑞普又分别受雇于谢菲尔德联、考文垂、普利茅斯、斯托克城、切斯特菲尔德和剑桥联等多支球队,一支到上世纪80年代才逐渐退出了英格兰足球的主流视线。
而瑞普隐退的原因是因为他的理论经过了20多年的发展之后,开始遭到了质疑。《倒转金字塔》的作者乔纳森·威尔逊就指出,瑞普的分析显示,他研究的比赛中91.5%的进攻传球次数不超过三次,逻辑上来说,91.5%的进球应该来自于这样的进攻,然而,实际上少于80%的进球是来自于这样的进攻。威尔逊指责瑞普基于错误的数据解读建立了一种错误的足球哲学。威尔逊的观点也使得“长传战术”开始被诟病。
不过,瑞普的工作虽然在后来受到了争议,但他的贡献在现代足球数据分析中仍然具有重要意义。他的方法也奠定了后来足球统计学和数据分析的基础。
现代足球比赛数据应用的标志应该是1996年opta的成立。
Opta是世界上第一家以足球赛事数据为核心业务的公司,opta的出现大范围普及了足球比赛的数据应用,同时也引领了足球比赛数据技术发展,并且成为了足球比赛数据定义的权威。
Opta成立之初只是一家记录与分析英超联赛比赛数据的小公司。在英超97-98赛季时,Opta成为了英超联赛的官方数据供应商。在经历了多年的发展和并购之后,如今的Opta已经发展成了全球最大的体育数据采集和服务商,自身营业范围也从原有的体育数据记录与分析进阶为以体育数据分析为核心竞争力的各项服务,他们为体育媒体、广播公司、技术公司、体彩机构、俱乐部和联赛提供商提供服务,涵盖了来自约70个国家的30多种不同体育运动项目的统计数据和信息。
Opta在成立的早起也是完全依赖于人工手动统计,需要现场数据采集员通过纸笔来记录信息,但是这种记录方式能及时记录的数据极少,仅限于射门、角球、进球、换人、红黄牌等关键信息,且数据准确度一般,只能够记录到关键事件大致的时间和相关人物。
随着IT技术的发展,2001年Opta率先淘汰了依靠纸笔记录的统计方法,开始转为人工为主的信息化采集。
起初的数据采集系统是将网格化的足球场设为半透明样式,覆盖在比赛直播的视频上。数据采集员的统计工作已经不像纸笔时期那样简单记录关键事件。传球路线成为了当时最为核心的工作内容,传球路线需要数据采集员们通过在起球点拖拽和点击鼠标来记录每个传球,并标记出是谁接到的传球。
但是,2D网格化的足球场是无法和第三人称视角的足球直播画面中球场上的影像精确对应的,数据采集员们记录信息时,鼠标会移动到与直播画面中的足球的位置距离较远的点上,而距离完全依赖于数据采集员的经验和主观判断,这种工作模式的数据记录必然存在较大的误差。当然数据具有争议的地方不仅限于此,还有各种技术性动作的判断,比如是不是过人、是不是抢断、是不是失误等技术事件的记录,高度依赖于数据采集团队的理解。
在这个时期,像传球路线这样的核心数据不再以离散的形式被记录,每一次传球都可以跟前后事件相关联,为数据分析师、教练以及数据爱好者提供了更多的分析空间。
2010年以后,光学识别技术与球员追踪系统开始大量应用于足球比赛的数据收集(大部分从事这类业务的公司都是成立在2005年之前)。在足球赛事中通过光学识别技术与球员追踪系统实现比赛数据采集的领域中,SportVU和Prozone是最早的掌握核心技术的两家公司。而这两家公司目前与Opta同属于Stats Perform集团旗下。
SportVU和Prozone均能够实现,在非人工参与的情况下,通过光学识别技术和球员追踪系统,在比赛中实时收集球和球员的位置数据,信息系统能够在一场足球比赛中产生百万级别的数据采集信息,记录下2000-3000种事件。原本交由人工完成的数据,现如今也大部分已被计算机视觉(CV)这种人工智能(AI)技术所取代。
不过,虽然现如今光学识别和无线定位的相关技术已经在职业赛场上和球队训练中得到了广泛应用,但是赛事数据的采集中,人工记录仍然是不可替代的环节。因为先进的技术系统虽然能自动实现——识别足球场上分别是谁,当前位置,当前速度等一系列基础信息,但仍然难以辨别球员的技术动作、关键事件或定性判断,比如射门和传球、越位进球、被犯规、失误等等。
所以,从另一个角度看,数据采集方案终究还是需要辅佐人去收集信息。即使未来技术进一步发展,但各类事件仍然难以用计算机语言去定义的话,那么最终的判断还是得由人来决定。
目前,对于绝大多数职业足球赛事,Opta都是唯一的数据采集和提供商。然后基于opta采集和提供的数据又有各种解释以及处理数据的机构,他们会把数据解释和处理成各种可视化的数据。当然,不同的数据解释服务商也有各自对数据的理解,这些理解的差异最终会反映在各家提供数据上的差异,这类公司包括WhoScored、Wyscout、TransferMarket、SofaScore、Squawka、SoccerWay等等。
比如WhoScored,是一家兼具免费数据与丰富数据可视化服务两大优点的专业足球数据网站,向用户提供大部分顶级足球赛事的公开数据和分析信息,涵盖基础数据展示、指标分析、技术事件分析和活动热点,甚至有专职分析师在赛后提供的比赛关键复盘信息。
比如Transfermarket是一个以球员转会费、球员身价评估、转会相关信息和各路八卦流言为主要内容的网站。在网站上可以查询到最新的转会情况、顶级转会记录、合同延续、球员价值等焦点信息。
也有像Wyscout这样的以付费服务为核心的数据解释及可视化服务商。Wyscout提供最大的足球视频和数据数据库,包括超过550000名球员和200多个联赛和锦标赛的资料。
Wyscout自定义了大量的数据模型,并将这些数据模型所解释的信息大量应用在Wysouct的平台,报告和API之中。像是第三助攻、丢球、拦截、传球到禁区、掩护队友等高级事件,一般数据解释服务商难以提供。这类数据大大丰富了评价选手的维度。
Wyscout的数据采集员还会将每场比赛细分为2000+个带有标记的视频剪辑片段。目前Wyscout的数据库存储了400+万场,从欧洲5大联赛(英超、德甲、西甲、法甲、意甲)到世界上最重要的青年锦标赛的比赛。这些标记带有具体的关键选手和技术事件,当教练、分析师团队想要去研究竞争对手的球员或者挖掘潜力选手时,不仅仅是在表现数据内进行判别,而是结合剪辑内容快速观看球员实际比赛表现(包括高光和失误),大大提高了调研效率。
近年来,国际足联也是在大力推动足球赛事领域数字化技术的应用落地,最为熟知的两大应用就是视频助理裁判(VAR,Video Assistant Referee)和半自动越位技术(SAOT,Semi-Automated Offside Technology)。
可能有很多人误会,以为VAR仅仅只是某项技术,而实际上VAR是一整套包含人在内的技术解决方案。VAR团队由4名视频助理裁判和4名回放操作员组成。所有视频助理裁判(绿衣,FIFA派遣)都是国际足联顶级视频比赛官员。回放操作员(黑衣,鹰眼公司派遣)根据裁判的要求选择并提供最佳摄像机角度。
半自动越位技术(SAOT)则是使用安装在球场上方的12个专用跟踪摄像头来跟踪球,以及每个球员身上的29个数据点,以每秒50次的频率计算其在球场上的确切位置。收集的29个数据点包括与越位相关的所有肢体部位。
而越位事件检测中另一个重要的判断依据——惯性监测单元,其传感器位于比赛用球的中心,以每秒500次的频率向VAR ROOM发送足球的数据,从而可以非常精确地检测触球点。
现在,各种高科技技术收到和人工智能的加持,使得足球比赛的数据采集越来越丰富和细致,但是足球比赛作为一个超级复杂的系统,比赛数据采集和数据分析仍然有很长的路要走,而很多足球数据领域的专家也仍然强调今后仍需开展更多研究。比如前微软数据科学家、曾在阿森纳从事了近十年数据分析工作的萨拉·路德就表示,她十分羡慕赛车所能产生的大量遥测数据,这些数据能够帮助团队做出改进并提升表现。她在接受采访时说道,“我们经常看F1的比赛,要是球队能有那样的数据就太棒了。”她还说,“足球里还有很多东西有待测量,或是正在测量,但我们还不清楚要如何分析。”
北单在那里买请加店主微信:av616X4