眼见不一定为实,数据不一定“不说谎”

眼见不必然为实,数据不必然“不撒谎”

羽则专栏 2019-07-21 12:15:11

数据从不撒谎。1个进球等于1个进球,2次助攻等于2次助攻,3次抢断等于3次抢断。统计数据就在那里,永远都是不偏不倚。

但利用数据得出的论断时常哄人。射门转化率高的先锋就真的更能把握机遇吗?创造机遇多的中场就真的有更大的防御贡献吗?抢断多的后卫就真的戍守更好吗?今天,就让我们来好好聊聊那些关于足球数据的懂得误区。

为什么数据会和实际抵触?

众所周知,这是一个属于大数据的年月。各类“15到30岁的人群均匀每周花多少小时看直播/打游戏/看小说”的静态层出不穷,告白里充斥着“延续N年销量领先”和“每十户家庭就有八户用XX”,明星们的微博粉丝和热搜数字直奔千万和亿级而去,就连你打开任何一个购物网站,首先看到的保举商品都是按照你以往的浏览与消费而主动生成的。

但这些所谓的大数据都对吗?为什么有的数据看起来言之凿凿,却和我们日常糊口里的所见所闻好像其实不一致呢?

来,让我们先看几个有趣的例子。

案例一:德国一家全国性报纸已经发过如许的报道,20岁以下的青少年他杀占到了全国他杀总数的25%,30-40岁的人占到了10%,超过70岁的老人他杀占比不足2%。因而他们得出推论,年齿越大他杀比率越低,我们随着年齿的增进会变得越来越容易找到幸福。

背地的故事:很快就有专业人士站进去吐槽了这家报纸,从总人数来说如许的数据没有问题,但疏忽了各个年齿群体的总人数。实际上,随着年齿的增进他杀率反而会不断上升。德国20岁以下的青少年他杀率不到10万分之1,但70岁以上老人的他杀率则濒临10万分之50。

这叫从片面数据得论断。

一叶障目,只站在一个地位天然只能看到一个角度,多几个角度的数据往往才能看到全貌。

案例二:特朗普2015年已经发过一则图文推特,图上表示美国大局部凶杀案都是黑人犯法
,数据来源于“旧金山犯法
统计中心”。那时正值参选美国总统时期,他因为这条推特受到了良多黑人的强烈抨击。

背地的故事:这个什么“旧金山犯法
统计中心”压根就不具有,这是一条不折不扣的假静态。

这就叫虚假数据。

就像某些流量明星发条微博动辄转发一两亿一样,疯的不是这个世界,而是相信这些“数据”的人。

案例三:1999年到2009年的十年间,美国上吊等窒息他杀的人数与政府的科研支出保持了惊人的同步增进,相关系数高达99.79%!这必然具有着某种不为人知的蝴蝶效应!

同一时光段,美国在游泳池溺死的人数也和尼古拉斯-凯奇参演电影的数目基础保持着同步变化,相关系数也到达了66.6%!这位已经的影帝每多拍一部烂片,竟然就有更多的美国人会在后院结束本身的生命!

背地的故事:这两张图切实来自于一家专门讥嘲大数据的网站,图片制作者先是找出两组毫不相关但曲线相似的数据,而后强行把他们搭成一对。

这就叫从数据倒推出现象。

抛开观察谈数据,一切都是耍流氓。

在我们的糊口中,这些片面剖析数据、制作假数据、从数据强行倒推出现象的情形屡见不鲜,足球圈里一样如此。以是接下来,就让我们回去看看那些稀有的足球数据,找找看有没有相似上文的懂得误区。

射门转化率不必然等于效力

射门转化率是什么意义?拿进球数除以射门的总次数,得出百分之多少的射门最终转化成了进球。射门转化率更高的先锋,理论上能够用更少的射门取得更多的进球,这不明摆着等于效力
更高吗?

良多人估计都是这么懂得的。比如去年底,我已经听过某位踢FIFA用时远超看球的友人(这个真不是内德)说了如许的一个观点:奥巴梅扬是英超射术最好的先锋。他的主要依据有两个:一是他在FIFA里用美羊羊的进球率远超阿圭罗、凯恩等人;二是那时有这么一个静态,奥巴梅扬联赛射门转化率超过了30%,比任何其他球员都高出5个百分点以上。

第一点这里就不吐槽了,我们重点聊聊第二点。这个数据切实是正确的,而且奥巴梅扬不仅那时的射门转化率高得惊人,全部
赛季下来射门94次也打入了22个进球,23.4%的射门转化率在英超一切球员里排到了第四位。

也许有的阿森纳球迷已感受到疑惑了,按理说射门转化率越高不是代表着射术越精吗,为什么在我们上赛季的观赛印象里,他明明就能出个超过十分钟的“吐饼”集锦呢?

这种印象切实也是正确的,请看英超官网发布的另外一项数据:球员错失绝对机遇次数榜。在该榜单里,奥巴梅扬以单赛季23次“吐饼”笑傲群雄。

为什么会如许?

让我们回头看看射门转化率:进球数/射门次数。这只是一个简略的数据,究竟门前三米面临空门是射门,在多人包夹戍守里强行起脚远射也是射门。单看射门转化率,切实并无法准确衡量每脚射门的难度和品质。若是单用这个数据来评议射术,那就犯了前文“片面数据得论断”的错误。

话题回到奥巴梅扬身上。众所周知,埃梅里麾下的阿森纳十分执着于这么一个防御套路:倒三角。这种防御套路里难的是如何从边路把球横敲到两头,门前抢到点之后的射门反而是相对简略的局部。因而,阿森纳在上赛季场均惟独12.3次射门,在全部
英超只排第11位。而他们创造了足足89次绝对机遇排到了英超第5,比起射门总数多出本身71次的死敌热刺还要略高一点。

作为枪手的锋线头牌,奥巴梅扬射门转化率高也有局部缘由是射门难度相对较低,而他错失绝佳机遇如此之多也能从另一个方面证实他的射术并非顶尖。美羊羊无疑是一个十分良好的先锋,但射门准度真的不是他最引以为傲的特点。

顺带一提,仔细
的球迷也许已发现除奥巴梅扬之外,威尔逊和瓦尔迪也同时出如今了射门转化率前十和错失机遇前五的行列内,这也和伯恩茅斯前场逼抢凶悍、莱斯特城回击效力
高,和
两队刀刃火力集中有着间接的联系。

至于错失机遇良多但在射门转化率榜单上排不上号的拉什福德和热苏斯……这么说吧,拉徒弟均匀每90分钟能拿到0.8次绝佳机遇,在曼联队内仅次于卢卡库;热苏斯每90分钟更是能有2次绝佳机遇,比英超任何其他球员都多出至少50%,跑位能力简直到达了顶级巨星级别。

但他俩的绝对机遇转化效力
——分列英超六强锋线球员倒数第三和倒数第一。谁和他俩一起远远落伍于其他先锋呢?莫拉塔。

创造机遇究竟是什么?

说完了锋线,我们再来聊聊中场。在评议防御型中场的能力时,时常会瞥见如许的两个数据名词:创造机遇(Chances Created)和要害传球(Key Passes)。单看字面意义,也许有些球迷会想到如许的画面:一记精妙直塞穿越对手防线,间接送到队友脚下构成
绝对机遇,也等于传说中的“烙饼”。

不外实际上,这两个词切实指的其实不必然是多么精妙的传球,而是泛指构成
射门前的最初一脚传球。Squawka等数据网站会把构成
进球的最初一传列为助攻,没能构成
进球的最初一传列为要害传球,两者相加为创造机遇。Whoscored等数据网站则统称为要害传球,并没有创造机遇的说法。

但不管采用哪种说法,归正要害传球其实不必然真的很“要害”,创造机遇也有也许基础就没有“创造”这一说。你在后场把球传给队友,他往前狂带30米重炮轰门,你都能在这项数据上+1。若是碰上某些奇特的队友,原地拨一下皮球都能变成创造机遇或者要害传球,以至还能“刷”出一次助攻。

当然,这个数据从微观上来说不必然能代表传球的品质,但从宏观角度仍是能够阐明

顺叙顶级传球手的价值。2006年到2018年的12年间,欧洲五大联赛惟独三名球员均匀每90分钟创造机遇的次数到达3次以上,分别是帕耶(3.06次)、托蒂(3.07次)和厄齐尔(3.5次)。

帕耶职业生涯始终没效能过太强的豪门,托蒂在统计开始的2006年都已30岁了,各自有着让人佩服的地方。而厄齐尔一马当先1的数据,足以阐明

顺叙谁才是真正的“欧洲饼王”。

但这个数据也有着必然的限制。比如球员A一脚精妙直塞打穿防线,两名队友反越位胜利面临门将二打一,球员B轻松横传球员C破门。那末
球员B会记上一次创造机遇和助攻,真正重要的球员A那脚在常规数据统计只是普普通通的一次传球,没别的了。

因而,也有局部数据公司在开发新的数据,比如射门前的倒数第二次和第三次传球。若是把射门前的最初1/2/3传加在一起除以出场时光,会有什么结果呢?2013年到2018年的5年间,英超这项复合数据的杠把子仍是饼王厄齐尔,但还有一名球员以十分微弱的劣势紧随其后,两人一马当先1其他球员。

大卫-席尔瓦。

不抢断也是好后卫

几个月之前,有一项十分受热捧的数据传遍足球圈:范戴克在2018-19赛季英超和欧冠联赛里没被人冲破过。开初在利物浦和巴萨的首回合竞赛里,虽然他仍然

依据没被任何人冲破,但面临梅西等人带球基础只退守不上抢的戍守风格,让局部坏事球迷发出了“不抢断怎么被过”的评论,和
送上了一个“且战且退范戴克”的绰号。

那末
问题来了,不怎么抢断的后卫究竟是不是好后卫?

先搬出两位传奇前辈来举个例子。在足球数据刚刚兴起的年月,剖析师惊讶地发现了一个看似很不合理的数据:意大利后卫马尔蒂尼场均抢断惟独0.5次。一样在阿谁年月,弗格森在数据狂助教麦克拉伦的建议下卖掉了斯塔姆,因为荷兰铁卫在脚踝手术之后场均抢断下降了简直一半,俱乐部以为这代表着他再也回不到岑岭。

你说他俩算不算好后卫?

开初的剖析师以为,这是因为他俩都有着丰富的经验和极其出色的选位,地位站好了别人基础就过不去,干嘛冒险去上抢?范戴克的“且战且退”也被以为是相似的道理,先锋们总是进展利用速度、盘带或者传球间接击败戍守者,遇到追随型反而会认为更加棘手,随着时光的推移能够挑选的处理球体式格局逐步淘汰,心理素质不好的就会越来越着急。

以是,才有了这种1V2的神级戍守。

因而,当真不要太在意中后卫的抢断和拦截数据。有的中卫喜欢且擅长上抢,比如基耶利尼和德利赫特;也有的中卫属于拖后站位型,比如范戴克。这只是风格差别,并没有好坏之分。

更何况,按照足球战术的普遍发展方向,中卫作为门将身前的最初一道防线,除非万不得已一般不会被要求冒险上抢。不信你看下面这个英超2018-19赛季场均抢断次数的排行榜,前十不是后腰等于边后卫,没有任何中后卫的影子。

再举个例子,你猜谁是上赛季英超六强里数据最难看的中后卫?

答案是穆斯塔菲。这位阿森纳中卫在英超联赛里均匀每90分钟有2.1次抢断,范戴克的1次还不到他的一半;有2次拦截,也濒临于范戴克1.1次的两倍;有5.5次突围,超越范戴克的5.3次;还有0.6次封堵对方射门,仍然

依据力压范戴克的0.5次一头。

单纯从一切戍守数据综合来看,穆斯塔菲的表现能够甩开范戴克好几条街,仿佛这才是堂堂正正的“世一名
”。然而看过竞赛的诸位,你们真的会这么认为吗?

关于控球率的那些事儿

对我们这些中国球迷来说,看足球直播也真的是一件不易的事儿。因为大局部竞赛都在深夜,就算是铁杆粉丝,切实也很难要求他们毫不错过客队每场竞赛。更不用说五大联赛和欧冠的精彩对决这么多,必然会出现良多“一觉醒来”看看比分和静态的情形。

在这种时分,也有良多人会扫一眼各项数据,从而对竞赛场面有个大概的粗略了解。此中最重要的一个参考名目,等于控球率。

(图)巴萨无疑是高控球率的最精采代表

那末
,你晓得控球率是怎么算进去的吗?

控球率=控球时光/单方控球总时光。所谓控球时光,指的是球在本方球员控制下,和
传球未被对方接触之前的时光。单方控球总时光为两者控球时光之和,也等于90分钟减去死球时光之后的净竞赛时光。

实际操作里,有些数据公司运用了高速摄像机主动捕捉和计算控球时光、记录员剔除死球时光的“机器+野生”操作,也有些数据公司间接运用了纯手工录入每个起止点的传统体式格局,因而造成了同一场竞赛差别数据网站显现控球率各不相同的现象。

而这个好不易统计进去的控球率,就必然能归纳综合场面上的谁优谁劣吗?

这个问题若是放在十几年前,答案是“能”。但放到今天,答案只会是“不必然”。

在控球率这一观点被数据公司推到舆论面前的早期
,人们很快发现控球率越高的球队越有机遇赢得竞赛的胜利
。这不难懂得,你有更多的时光把球控制在本身脚下,天然会有更多的防御机遇去争取进球。2007-08赛季英超联赛里,控球率不超过40%的一方最终只赢下了19场竞赛,能够说输掉控球权就约等于输掉了竞赛。

但到了2015-16赛季,一样是控球率不超过40%的一方,其胜利
场次已到达了52场,比八年前的两倍还多。

阿谁赛季,莱斯特城以场均倒数第三的42.4%控球率和倒数第二的70.5%传球胜利率,成为了回击制胜的最佳代言人。

国家队的大赛一样有着相近的趋势。2010年南非世界杯,控球率低于45%的球队赢下竞赛的几率惟独可怜的3%,西班牙式的传控足球到达了岑岭。但到了2016年欧洲杯,控球率低于45%的球队赢下竞赛的几率已疯涨到了30%,足足是六年前的十倍,葡萄牙面目全非的防反笑到了最初。

当然,我的意义其实不是什么“传控已死回击当道”,控球率更高的球队一般情形下仍然

依据有着更好的场面和更大的胜率,尤其是在漫长的联赛里。但伴随着足球战术进一步走向多样化和复杂化、杯赛各队实力差距逐步拉近,有更多的球队挑选主动让出局部控球权,来换取更好的回击机遇。如许的球队,防御要挟未必就比主打控球的对手更少。

控球率的绝对意义,或许在逐步变淡。

写在最初

熟习我的读者都晓得,我大概是懂球帝里最喜欢用数据的专栏作者(笑)。没错,作为一个已经多年工作都在和财报打交道的人,我对“冷冰冰”的数字的信任程度,或许比知面不知心的活人还要更多一些。

但我个人在剖析竞赛时始终保持着一个准绳,那等于:先看竞赛得出观点,再去寻觅数据来验证正确与否。因为水平有限和每个人的懂得差异,也许有时我对一些数据的意见和局部读者所想的其实不一致,但至少能压服本身。

数据不撒谎,但千万不要科学你看到的一切数据。

  • 以上仅代表作者观点,并非懂球帝官方观点
  • 自媒体如有侵权,请联系
分享到:

更多精彩报道,尽在https://theohso.com