俄羅斯世界杯各大豪門國(guó)家隊(duì)頻頻爆冷。例如巴西隊(duì)本是本屆世界杯的奪冠熱門,但是卻在1/4決賽中輸給了比利時(shí)。桑巴軍團(tuán)甚至在離開俄羅斯回到巴西的路上,遭到本國(guó)極端球迷用石頭砸球隊(duì)的大巴泄憤。
而另一方面卻又有媒體報(bào)道,巴西媒體認(rèn)為,巴西隊(duì)之所以能夠獲得五次世界杯冠軍,與堅(jiān)持吃本國(guó)特色餐飲黑豆飯有關(guān),而這次之所以沒有表現(xiàn)好,是因?yàn)轱嬍嘲才派铣霈F(xiàn)了問題。
是因?yàn)轱嬍?,還是因?yàn)橘惽靶菹?,抑或其他原因,到底是什么最終決定了比賽的勝負(fù)?數(shù)據(jù)智能、人工智能相關(guān)領(lǐng)域飛速發(fā)展的今天,數(shù)據(jù)科學(xué)家如何看待對(duì)足球比賽的預(yù)測(cè)?針對(duì)這個(gè)領(lǐng)域的發(fā)展,我們和北京猜猜科技的ceo謝波進(jìn)行了探討。
“世界杯的預(yù)測(cè)存在非常大的難度,根本原因是球隊(duì)之間交戰(zhàn)記錄太少,同時(shí)球員陣容四年一次更換,沒有足夠的歷史數(shù)據(jù)沉淀幫助建模”,謝波說道,“如果誰(shuí)宣稱自己能夠預(yù)測(cè)世界杯比賽勝負(fù),基本上是對(duì)基本面數(shù)據(jù)的重構(gòu)和深度建模,但是放在具體樣本來(lái)看,效果也差強(qiáng)人意”。
“所以世界杯仍然是最具不確定性的國(guó)際賽事之一。”謝波補(bǔ)充道,“類似的比賽,五大聯(lián)賽的預(yù)測(cè)我們基于獨(dú)有的歷史樣本數(shù)據(jù),已經(jīng)做到非常好的預(yù)測(cè)程度了。”
“足球比賽每個(gè)球員都無(wú)法確保自己能夠穩(wěn)定發(fā)揮,教練的戰(zhàn)術(shù)執(zhí)行也經(jīng)常變陣…存在這么多比賽的機(jī)動(dòng)因素,你們?nèi)绾问侨绾螌?duì)比賽進(jìn)行建模和預(yù)測(cè)的?”
“這里需要首先科普幾個(gè)最基本的概念:賠率、預(yù)測(cè)概率和價(jià)值回報(bào)率。然后我們可以清晰的看到人工智能正在如何改變這個(gè)行業(yè)?!?/p>
我們知道,足彩的賠率是博彩公司綜合考慮給出足球比賽的投注回報(bào)。例如博彩公司開出主隊(duì)贏2.25的賠率,其意義就是投注者如果投主隊(duì)獲勝,且比賽結(jié)果真是主隊(duì)獲勝,則投注者可以獲得其投注額的2.25倍的回報(bào)。而大家對(duì)比賽結(jié)果的判斷,對(duì)勝平負(fù)的三種結(jié)果給出一定的概率估算,就是預(yù)測(cè)概率。足彩賠率和預(yù)測(cè)概率成為核心的兩點(diǎn),在此基礎(chǔ)上,我們還會(huì)關(guān)注價(jià)值回報(bào)率,該指標(biāo)則是綜合考慮了賠率和結(jié)果概率,價(jià)值回報(bào)率表征了投注此結(jié)果的期望回報(bào)值。
所以,我們站在中國(guó)體育競(jìng)彩玩家的角度看這個(gè)問題:如何用最少的錢換回最大的回報(bào)率?類似股票投資,里面有最優(yōu)的投資組合,而人工智能可以高效的選出這些組合!這里面有比較成熟的行業(yè)理論:
returns = max { σ odds | pro, val, α } ,其中odds為預(yù)測(cè)結(jié)果的賠率,pro為預(yù)測(cè)的概率,val為預(yù)測(cè)的價(jià)值回報(bào)率,α為選擇的策略…總而言之,這是一個(gè)千錘百煉的行業(yè)公式,各大博彩公司的精算師正是靠這個(gè)吃飯。
“為此,猜猜體育團(tuán)隊(duì)開發(fā)了基于深度學(xué)習(xí)技術(shù)的比賽預(yù)測(cè)模型,以及基于價(jià)值回報(bào)率的投注策略模型。猜猜體育核心來(lái)自百度、騰訊、滴滴的人工智能技術(shù)、算法和產(chǎn)品團(tuán)隊(duì),將人工智能的優(yōu)越性引進(jìn)足彩領(lǐng)域,向用戶提供最優(yōu)的投注機(jī)會(huì)、冷門提醒和實(shí)時(shí)的滾球盤投注策略?!?/p>
1、基于深度學(xué)習(xí)的比賽結(jié)果預(yù)測(cè)模型
深度學(xué)習(xí)在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域獲得了巨大的成功。將深度學(xué)習(xí)技術(shù)引入到足球比賽的結(jié)果預(yù)測(cè)中,可以綜合利用歷史的比賽記錄,以及各種實(shí)時(shí)的數(shù)據(jù)信息,進(jìn)行訓(xùn)練和計(jì)算。無(wú)論是賽前球員的傷病,還是教練的奇招,眾多的線索都可以從海量的數(shù)據(jù)中能獲得“蛛絲馬跡”,幫助模型得到準(zhǔn)確的預(yù)測(cè)結(jié)果。

圖:基于深度神經(jīng)網(wǎng)絡(luò)的比賽預(yù)測(cè)
進(jìn)一步的,團(tuán)隊(duì)后續(xù)還利用多組子模型進(jìn)行多層次的結(jié)果融合,就像做一道完美的大餐,肯定要經(jīng)過不斷地嘗試,才能做出最美味的食物,獲得最大的性能收益。謝波表示,當(dāng)前猜猜的模型可以達(dá)到68%的預(yù)測(cè)準(zhǔn)確性。
世界杯期間,基于這樣的技術(shù)優(yōu)勢(shì),猜猜體育團(tuán)隊(duì)在世界杯期間開放的小程序向廣大彩民和球迷發(fā)起了一個(gè)挑戰(zhàn),ai和大家同時(shí)對(duì)一場(chǎng)比賽的進(jìn)球時(shí)間進(jìn)行預(yù)測(cè)。
“在球賽開始之后,遠(yuǎn)遠(yuǎn)不斷的數(shù)據(jù)快速的產(chǎn)生。實(shí)際上賽中的預(yù)測(cè)準(zhǔn)確率是非常高的,比如預(yù)測(cè)賽中進(jìn)球時(shí)間?!敝x波補(bǔ)充道。

圖:猜猜科技在世界杯期間推出的小程序
2、引入價(jià)值回報(bào)率的最優(yōu)投資組合的搜索
在已知結(jié)果概率和賠率的情況下,選擇哪些比賽進(jìn)行投注,投注的比例又是如何,這是投注策略所關(guān)注的問題。不同的預(yù)測(cè)概率,會(huì)有不同的價(jià)值回報(bào)值,根據(jù)不同的價(jià)值回報(bào)率,我們會(huì)采取不同的下注策略,這就涉及到一個(gè)最優(yōu)投資組合的搜索問題。搜索的空間是根據(jù)賠率,預(yù)測(cè)的概率,價(jià)值回報(bào)率以及不同的預(yù)測(cè)模型等組合而成,如何在百萬(wàn)計(jì)的投資組合中進(jìn)行最優(yōu)搜索,成為核心問題。 當(dāng)然,這些復(fù)雜的計(jì)算過程交給我們的ai就好。

圖:基于遺傳算法的參數(shù)組合搜索
猜猜體育團(tuán)隊(duì)利用剪枝優(yōu)化的策略,結(jié)合遺傳算法等多種搜索策略(總之,就是一些算法和策略),對(duì)最優(yōu)參數(shù)空間進(jìn)行檢索。為了測(cè)試這套模型, 猜猜體育團(tuán)隊(duì)對(duì) 2012 年到 2018 年期間 2 萬(wàn)場(chǎng)足球比賽進(jìn)行了模擬訓(xùn)練,在測(cè)試集300場(chǎng)比賽進(jìn)行測(cè)試,回報(bào)率為41%。均注 1000 元,下注 300次,投入30萬(wàn)元,獲得 12.3萬(wàn)元的回報(bào)。

最終,猜猜體育將在這充滿偶然性的體育比賽打造出可以穩(wěn)定預(yù)測(cè)結(jié)果的深度學(xué)習(xí)模型。對(duì)于體育迷來(lái)說,押幾個(gè)小注來(lái)支持自己心愛的球隊(duì)自然十分有趣,通過ai的加持,能得到更高更穩(wěn)定的收益回報(bào)。雖然我們?cè)谏衔闹刑岬搅撕芏鄬I(yè)性的術(shù)語(yǔ),但其原型在生活中都可以找到。廣大體育迷只需要選擇好自己支持的球隊(duì),剩下的就交給我們的ai吧。
“百度出來(lái)的工程師基本都有一些人工智能的情懷,有很多工程師希望用數(shù)據(jù)智能的方式去嘗試各種各樣的項(xiàng)目。競(jìng)技體育賽事的預(yù)測(cè),其實(shí)特別能夠用到大數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)的威力。”
據(jù)郭楊,猜猜科技cto介紹,目前他們已經(jīng)積累了歐洲主流聯(lián)賽近10年的數(shù)萬(wàn)場(chǎng)比賽歷史數(shù)據(jù)、以及百萬(wàn)量級(jí)的賽中實(shí)時(shí)數(shù)據(jù),針對(duì)比賽結(jié)果預(yù)測(cè)準(zhǔn)確率已經(jīng)超過了大部分的人類專家。
“你們對(duì)足球比賽的預(yù)測(cè)效果如何?”
“我們神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果和很多資深彩民的投注策略樣本進(jìn)行了對(duì)比,發(fā)現(xiàn)很多有意思的細(xì)節(jié)。例如,大部分人在購(gòu)買足球競(jìng)彩下注的時(shí)候,都在犯一些統(tǒng)計(jì)學(xué)上的錯(cuò)誤。還有一些情況下,博彩公司給出的盤口本身存在很多誘導(dǎo)性。如果不從數(shù)據(jù)進(jìn)行客觀的分析,這些很難被大家意識(shí)到,長(zhǎng)期下來(lái),普通的球迷和彩迷在期望收益方面很難獲得正收益。但是我們的神經(jīng)網(wǎng)絡(luò)模型結(jié)果把大量的類似因素全部都捕捉到了。舉個(gè)例子,比如大部分人潛意識(shí)中,更傾向于投注上盤,而神經(jīng)網(wǎng)絡(luò)的結(jié)果顯示,機(jī)器選擇下盤的比例會(huì)高出很多。歸根到底,機(jī)器在預(yù)測(cè)比賽勝負(fù)的過程中,保持了絕對(duì)的理性和客觀。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“機(jī)電號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.
