400-010-3808

收藏我們

行業(yè)資訊

Industry Information

伍強(qiáng)課堂:世界杯預(yù)測中的數(shù)學(xué)原理
項(xiàng)目啟動時(shí)間:2023-01-03
分享至:

        第22屆足球世界杯已落下帷幕,這一屆世界杯最大的贏家是阿根廷,是梅西,更是億萬期盼梅西封神的球迷。將近一個(gè)月的比賽跌宕起伏、精彩紛呈。球賽開始前和比賽期間,預(yù)測結(jié)果更是成為球迷們的最大興趣。世界上的各大媒體,電視臺,也紛紛加入到預(yù)測中來。我雖然算不上一個(gè)具有專業(yè)水準(zhǔn)的球迷,但也禁不住周邊朋友們熱鬧場面的誘惑,對多場比賽結(jié)果進(jìn)行預(yù)測。

        預(yù)測的最大樂趣是增加了看球的樂趣,本來是一場與自己無關(guān)的比賽,因?yàn)橛辛祟A(yù)測,就特別期望自己預(yù)測正確。而且一旦結(jié)果與預(yù)測一致,那種成功的喜悅,很難用語言來形容。

        預(yù)測足球比賽結(jié)果是一門技術(shù)活,首先要對球隊(duì)有比較深入的了解,包括球員構(gòu)成、綜合能力、歷史戰(zhàn)績、世界排名、當(dāng)家球星、球員狀態(tài)、對手情況等,了解越多,預(yù)測似乎就越準(zhǔn)確。但實(shí)際情況往往出乎意料甚至大相徑庭。以牛津大學(xué)預(yù)測為例,他們用自己的數(shù)學(xué)模型計(jì)算出來的預(yù)測結(jié)果如圖1所示。

圖1 牛津大學(xué)給出的預(yù)測模型

        從圖1可以看出,盡管引入了非常復(fù)雜的數(shù)學(xué)計(jì)算,并對各隊(duì)的歷史數(shù)據(jù),交戰(zhàn)結(jié)果做了詳細(xì)的分析,但預(yù)測結(jié)果卻不盡人意。小組賽也就有一半預(yù)測對了勝負(fù),其中進(jìn)入決賽的兩支隊(duì)伍都錯(cuò)了。其他很多預(yù)測機(jī)構(gòu)也大致相同。

        其實(shí),影響比賽結(jié)果的因素很多,球隊(duì)實(shí)力固然非常重要,但進(jìn)入32強(qiáng)的球隊(duì)大部分實(shí)力都不弱,尤其是進(jìn)入淘汰賽階段更是如此。這時(shí)候,球隊(duì)的戰(zhàn)術(shù)安排,球員臨場狀態(tài)、取勝欲望、團(tuán)隊(duì)配合等方面就顯得尤為重要。此外,運(yùn)氣也是比賽的一部分,并且往往成為左右比賽結(jié)果的非常重要的因素。

        足球比賽既考驗(yàn)雙方的能力,也是對雙方隊(duì)員面對面比拼時(shí)心理素質(zhì)的檢驗(yàn)。盡管結(jié)果不可預(yù)知,但其中卻蘊(yùn)含有嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)原理。今天我們就談?wù)勥@個(gè)問題。

        大家知道,概率論是解決我們?nèi)粘I詈芏鄦栴}的重要數(shù)學(xué)理論。越來越多的足球預(yù)測,都是以概率論作為基礎(chǔ)進(jìn)行的。上述牛津大學(xué)的預(yù)測也是基于概率論的。但概率論如何運(yùn)用,卻是有很多講究。

        一般來說,在一個(gè)非受限空間,一個(gè)獨(dú)立事件發(fā)生的概率總是符合正態(tài)分布的。其定義是:若隨機(jī)變量X服從一個(gè)位置參數(shù)為μ、尺度參數(shù)為σ 的概率分布,且其概率密度函數(shù)為:

        則這個(gè)隨機(jī)變量就稱為正態(tài)隨機(jī)變量,正態(tài)隨機(jī)變量服從的分布就稱為正態(tài)分布,記作X~N(μ,σ2),讀作X服從N(μ,σ2),或X服從正態(tài)分布。圖2是正態(tài)分布分布密度函數(shù)曲線圖。

圖2 正態(tài)分布函數(shù)曲線(來源于網(wǎng)絡(luò))

        當(dāng)實(shí)際發(fā)生概率很小時(shí),我們稱其為小概率事件,從標(biāo)準(zhǔn)概率分布圖中可以看出,位于區(qū)間(-3σ,3σ)以外的概率小于0.2%。所以,在很多場合下,就不予考慮。比如,我們在物流系統(tǒng)中采用稱重法來檢驗(yàn)圖書揀選的準(zhǔn)確性時(shí),就是選取了這一標(biāo)準(zhǔn)。在很多工業(yè)場合,標(biāo)準(zhǔn)會進(jìn)一步提高,比如我們常說的6σ檢驗(yàn)標(biāo)準(zhǔn),就要求達(dá)到(-4.5σ,4.5σ)范圍,其精確度將達(dá)到3.44ppm(即百萬分之三點(diǎn)四四)。

        再回過頭來看世界杯。如何運(yùn)用數(shù)學(xué)原理進(jìn)行比賽的預(yù)測呢?這是一個(gè)比較復(fù)雜的問題。如果單就一場球來看,其實(shí)就是實(shí)力對比說了算,作為一個(gè)獨(dú)立事件,沒有參考數(shù)據(jù),很難做出準(zhǔn)確預(yù)測。比如德國對日本,一般情況下,大家預(yù)測都認(rèn)為日本會輸。但是要進(jìn)一步定義輸?shù)母怕屎洼數(shù)谋确?,就比較復(fù)雜了。這就牽涉到一個(gè)概率問題。比如說德國輸?shù)母怕?,其?shí)我們可以讓他們踢1000場球,看看比分會如何分布,這樣結(jié)果就出來了。但實(shí)際上做不到。因?yàn)榧词辜刑?000場,這個(gè)結(jié)果也是有問題的,它與我們擲1000次硬幣的情況有很大不同。因?yàn)楸荣愂艿饺藶榈母蓴_。其結(jié)果與自然發(fā)生的有出入。而實(shí)際上,集中踢1000場在時(shí)間上也沒有可能。所以,我們在預(yù)測一場球時(shí),就顯得很困難,事實(shí)上因?yàn)槭录碾S機(jī)性而變得無法預(yù)測。如果我們假設(shè)德國和日本踢1000場球的結(jié)果是600勝,300平,100負(fù),這一結(jié)果對指導(dǎo)預(yù)測其實(shí)幫助不大,但如果聯(lián)系到歷史的比賽,我們還是會做出比較可信的預(yù)測。另一方面,我們把一場球放到一個(gè)系統(tǒng)中看,將會又是一番景象。比如我們將德國對日本比賽放到一個(gè)大的空間,如世界杯大賽這個(gè)環(huán)境看,德國屬于第一梯隊(duì),日本屬于第三梯隊(duì),這樣看的樣本空間就大得多。因?yàn)橛写罅康牡谝惶蓐?duì)與第三梯隊(duì)比賽的樣本可供參考。我們可以從這些歷史樣本中得出一些有用的結(jié)論,如雙方歷史上的勝率,本屆已經(jīng)完成的比賽的情況等,從而指導(dǎo)預(yù)測的結(jié)果。

        在小組賽期間,我們知道,每個(gè)小組內(nèi)的強(qiáng)弱還是比較分明的。這樣大家的預(yù)測總體來說準(zhǔn)確性要高一些,這是我們應(yīng)用概率論的基礎(chǔ)。但另一方面,我們也要看到,比賽結(jié)果還是有一定比例的場次出乎大家的意料之外。比如亞洲球隊(duì)的爆發(fā),日本連勝德國和西班牙,使得德國最終小組未能出線。開始時(shí),很多中國球迷擔(dān)心亞太區(qū)球隊(duì)會被剃光頭,但事實(shí)上,不僅有3支球隊(duì)(含澳大利亞)順利出線,而且每支球隊(duì)都有上佳表現(xiàn)。對此,我開始就大膽提出兩個(gè)假設(shè):第一是亞洲球隊(duì)必定會有球隊(duì)進(jìn)入第二輪;第二是比賽必定會有冷門產(chǎn)生。通過對各小組進(jìn)行分析,首先把出線的球隊(duì)寄托在日本、韓國身上,并將日本對德國、韓國對西班牙、沙特對阿根廷三場比賽定義為最容易爆冷的比賽。其中之所以定義沙特對阿根廷會爆冷,則基于阿根廷是奪冠大熱門的假設(shè),并且其此前已經(jīng)35場不敗的記錄,已經(jīng)平了世界紀(jì)錄。概率論的理念就是:阿根廷即使要破世界紀(jì)錄,也只會破一點(diǎn)點(diǎn)(小概率事件),也就  是說最多再贏1~2場;阿根廷要想奪冠,就不能在淘汰賽輸球,小組賽輸球是其唯一機(jī)會。因此,其輸給沙特的理由最充分(第一場可能性最大)。比賽的結(jié)果印證了這一猜想。

        到了淘汰賽階段,大家對預(yù)測英國和法國比賽產(chǎn)生分歧。認(rèn)為兩隊(duì)水平相當(dāng),英國更勝一籌。但實(shí)際過程看,是英國幾乎沒有希望。但既然是預(yù)測,邏輯上要有一致性才行。很多機(jī)構(gòu)預(yù)測法國和巴西爭奪冠軍,這是有一定道理的,事實(shí)上要做到這一點(diǎn),兩隊(duì)在淘汰賽中,它幾乎就不可能會輸。要怎么樣才會輸呢?需要爆冷才會輸。我們知道,在世界杯上,爆冷是有其必然性的。從歷史數(shù)據(jù)看,總會有一定比例的比賽會爆冷,有些還是大冷門,這就不是小概率事件了。法國輸給英國根本就不算冷門,法國只有輸給像澳大利亞這樣的隊(duì)伍才是大冷門。另一邊就不同了,巴西對克羅地亞,結(jié)果是巴西爆冷出局;西班牙對摩洛哥,同樣是西班牙爆冷出局;到了葡萄牙對摩洛哥,其實(shí)已經(jīng)不是爆冷了,葡萄牙隊(duì)內(nèi)出現(xiàn)嚴(yán)重問題,才使得摩洛哥一舉擊敗葡萄牙,挺進(jìn)4強(qiáng)。

        其實(shí),后面的4場比賽,結(jié)果早就失去懸念。盡管他們的能力差異在毫厘之間,但再爆冷的幾率已經(jīng)很低了。其一是克羅地亞和法國進(jìn)入決賽,這幾乎是不可能的結(jié)果,因?yàn)檫@種重復(fù)上屆比賽結(jié)果的可能性微乎其微,歷史上只有一次,而且克羅地亞水平本來就有限,打敗巴西,進(jìn)入4強(qiáng)已經(jīng)是超水平發(fā)揮。其二是梅西封王眾望所歸,4次沖擊冠軍,無果而終,本屆比賽,將是梅西最后的機(jī)會。梅西占盡了天時(shí)地利人和。人們無法想象沒有獲得世界杯的梅西,會如何與其球王身份相匹配。第三是法國衛(wèi)冕也是難上加難。試問,世界上除了巴西衛(wèi)冕成功過一次外,還有誰能獲得這份殊榮?以法國足球的底蘊(yùn),根本不可能達(dá)到這一高度。

        所以,同樣是概率論的應(yīng)用,在臨場操作時(shí)應(yīng)該從多方面考慮,而不能僅僅局限于一個(gè)維度。比如,預(yù)測決賽會不會出現(xiàn)帽子戲法這一事件,有幾個(gè)因素支持這一預(yù)測,第一是全部21屆比賽,居然出現(xiàn)了52個(gè)帽子戲法,平均每屆2.47個(gè),本屆比賽還只有1個(gè),這是不正常的;第二,從決賽的氛圍來看,從兩隊(duì)的風(fēng)格來看,從球星的能力和機(jī)會看,完全是有可能的,并且可能是大概率事件。

        世界上的事情,往往都包含有一定的數(shù)學(xué)原理,被數(shù)學(xué)原理所制約。但即使如此,由于未來的不確定性仍然使得預(yù)測不可能百分之百準(zhǔn)確,預(yù)測歸根到底是一種猜測,它不代表結(jié)果的確定性。我們知道,再小的概率也是可能發(fā)生的,但如果我們明白背后的邏輯,將會使得猜測準(zhǔn)確性更高。足球比賽尤其如此。因?yàn)?,每場比賽雖然時(shí)間很長,但進(jìn)攻到禁區(qū)并且獲得得分的機(jī)會卻不多。所謂的偶然性就成為左右比賽結(jié)果的重要因素。強(qiáng)隊(duì)如果沒有抓住機(jī)會,反而被弱隊(duì)抓住寶貴的機(jī)會,結(jié)果就會逆轉(zhuǎn),這也是足球最具有魅力的地方。當(dāng)然,強(qiáng)弱如果是一邊倒的情況,所謂的偶然性基本是不可能發(fā)生的。


圖片來源于網(wǎng)絡(luò)

蜂鳥中臺

立即前往 >

無憂服務(wù)

立即前往 >

行業(yè)方案

立即前往 >

聯(lián)系我們

sales@vstrong.com

在線服務(wù)

服務(wù)熱線

400-010-3808

TOP