第85屆奧斯卡金像獎頒獎晚會將于美國當地時間2月24日舉行,奧斯卡小金人最終將花落誰家?近日,由微軟研究院的David Rothschild通過對奧斯卡入圍影片相關數據分析,預測出本屆奧斯卡各項大獎的最終歸屬。
大家可以在David Rothschild的博客上看到他的最新預測結果。作為預測努力的一部分,David Rothschild與微軟團隊合作開發了一款Excel應用——Oscars Ballot Predictor(奧斯卡投票預測器),該應用為所有24個類別的奧斯卡得獎獎項提供實時預測。
David Rothschild所提供的一些獲獎概率信息:
·最佳影片獎:Argo(《逃離德黑蘭》),獲獎可能性93.9%。
·最佳導演獎:斯蒂芬·斯皮爾伯格(Steven Spielberg)(影片《林肯》),獲獎可能性83.7%。
·最佳男演員獎:丹尼爾·戴-劉易斯(Daniel Day-Lewis)(影片《林肯》),獲獎可能性99%。
·最佳女演員獎:詹妮弗·勞倫斯(Jennifer Lawrence)(影片《烏云背后的幸福線》)(Silver Linings Playbook),獲獎可能性70.7%。
當然,這些數據只是初步預測,David Rothschild說:“我對今年部分獎項的預測很有把握,但預測并非100%,期待奧斯卡頒獎晚會上的最終結果。”
David Rothschild的努力方向是利用大數據改變我們的預測方式,為微軟創建更好的產品和服務做貢獻。去年,David Rothschild就曾使用一個通用的數據驅動型模型,正確預測了美國50個州和哥倫比亞特區共計51個行政區中50個行政區的總統大選結果,其預測準確性高于98%。
David Rothschild表示:“我預測奧斯卡金像獎得主的方法與預測其它事情的方法完全相同,其中包括政治。首先關注最有效的數據,然后創建不受任何特別年份結果干擾的統計模型,所有模型都根據歷史數據進行測試、校正,我們在建模時很有耐心,確保模型能夠正確預測外樣本結果,而不僅僅是過去發生的結果。我們創建的模型是用來預測未來的,而不是預測過去的。”他指出:“科學是相同的,但證明哪些數據最有用卻存在千差萬別。”
你或許會認為一個能夠攻克選票近1.27億張變化莫測總統大選的預測模型也一定能夠在預測不太復雜的事件中輕松獲勝,如奧斯卡投票,其投票成員不足6000人,但美國總統大選與奧斯卡投票采用的數據大相徑庭。
David Rothschild透露:“我通常關注四個不同類型的數據:投票數據、預測市場數據、基本數據和用戶產生的數據。在預測政治時,我采用基礎數據如過去的選舉結果、義務和經濟風向標。通過基礎數據建立一個基準,然后轉向預測市場數據和投票數據,因為這兩個類型的數據吸收并包含了更多選舉信息。2012年總統大選預測時,我使用了少量用戶產生的數據,但Xbox Live數據對補充重大事件實時分析起了關鍵作用。”
“預測奧斯卡金像獎花落誰家時不需要投票數據,基本票房回報和電影評級數據也不統計在內。我更關注的是預測市場數據,這是主要因素,同時采用部分用戶產生的數據,這有助于理解電影內部和不同類別之間的相關度,例如影片《林肯》會贏得多少個獎項?”David Rothschild說。
David Rothschild強調:“每當我關注一個新領域,我都會認真考慮一些關鍵事情,確保自己的預測更有意義。”首先,我會確定最中肯的預測。至于奧斯卡金像獎得主預測,我關注的是所有24個類別的獲勝概率,并會預測各個類別主流電影的總獎項。其次,我的所有預測結果會實時更新。從研究觀點看,實時更新預測結果至關重要,我們能夠獲悉最初預測與最終事件之間發生的不同事件的價值。這些事件就是奧斯卡獎項歸屬的前奏。最后,我借助特定領域的歷史數據建模,然后通過不斷升級模型確保預測的準確度。我還想強調的是,我們所做的一切都是為了盡可能保證領域獨立性,確保所有問題的可衡量性。如果該研究能夠催生出更高效的預測方法、在眾多領域適用于大量問題,將對微軟、對學術界和這個世界都有價值。”(網易)