Netflix片單沒有你想的這麼簡單,看團隊怎麼解讀客製化系統

相信有訂閱Netflix的人都對首頁不陌生,充斥著一整個螢幕的影片包含你的片單、觀看紀錄、跟Netflix認為你有可能感興趣的推播。

 

但是你知道嗎?每個人看到的海報都不一樣,這是因為Netflix團隊研發出一款演算法,

讓片單根據會員的喜好類型、地區、互動、國家、語言篇好等,來對你推送你可能喜歡的電影。

 

而整個主頁的關鍵就在於團隊研究發現「圖像勝過千言萬語」,一個好的畫面可以直接抓住使用者的心,勝過繁瑣的文字。

 

而團隊也發現,能夠透過不同的演員、場景、畫面甚至是標題配置來展示片單,並且進行測試來吸引會員點擊、甚至觀看。

 

工具以及算法

AVA是一系列工具和算法,團隊從視頻中截取高質量的圖像。

例如:一季平均電視節目(約10集)總共有近900萬張圖片,Netflix要求團隊篩選某些畫面,確定能夠吸引到觀眾注意。

並且創造演算法則,讓圖片針對美學、畫面、創意等需求來排列

 

整個篩選過程如下圖:

 

畫面呈現

Netflix在畫面的配圖上用盡心思,例如他讓一個你可能喜歡的演員,在該劇可能吸引你的表情,出現在你沒看過的片單上。

 

如下圖,左邊是你曾經看過的電影,而右邊則是經過演算法推算出你可能感興趣的配圖

 

又或是如果我們給一個看過很多愛情片的人推播馬特•達蒙(Matt Damon)和明妮•德里弗(Minnie Driver)的劇照也許會讓他對《心靈捕手》感興趣。

 

而一個看過很多喜劇片的人,如果看到包含羅賓•威廉姆斯(Robin Williams)的圖片也許也會想要點擊這部片。

 

不斷測試

Netflix收集了一批關於會員如何使用該服務的數據,然後對這批數據運行一個新的機器學習算法。

接下來再透過A / B測試針對當前的生產系統測試這種新算法,在隨機的成員上進行測試,

幫助他們了解新的算法是否適用於當前系統。

舉例:A組中的成員接觸到原本的使用者經驗,而B組中的成員獲得一組新的使用者經驗。

如果B組中的成員與Netflix有更高的互動度,那麼他們會將新演算法推廣到整個成員群體。

 

如下圖:

 

但不幸的是,這種測試方式並不會讓使用者的體驗方式更好,

所以他們研究了新的方式:「上下文老虎機」,此方式能針對每位用戶和情境快速找出最優的個性化配圖選擇。

「上下文老虎機」透過在學習模型的預測中注入受控的隨機變量獲得的。

隨機化方案的複雜程度可以變化,從具有均勻隨機性的公式(epsilon-greedy formulations)到能夠根據模型的不確定性自適應地改變閉環方案,類似數據探索(data exploration)。

 

有了這樣的探索,並記錄每張配圖的隨機化的信息,之後再修正偏斜的選擇傾向,用零偏差的方式執行離線模型評估。

 

基於記錄的圖像探索數據的重放,不同算法的平均圖像獲取分數(越高越好)。

 

系統以喜劇演員羅賓威廉姆斯的形象,用於偏好喜劇傾向的TA,同時也選擇一個接吻情侶的圖片,讓整部片的圖片展示更傾向於浪漫。

 

 

結論

 

通過這種方法,我們已經邁向了提供會員個性化第一步,並且讓使用者經驗獲得了明顯的改善,所以目前已經將它推廣給每個人!

這樣子的實例不僅是我們推薦的內容,也是我們向會員推薦的方式。但是目前當然還是有許多機會以及方法可以將此初步的演算法做提升。

 

例如以預告片、影片概念或是其他數據來盡可能的提升個人化程度,又或是一個更廣泛的問題:幫助藝術家和設計師找到應該加入什麼樣的元素以使得一個影片描述更加吸引人以及計算視覺藝術的技術。

 

圖片來源&參考資料:

https://medium.com/netflix-techblog/ava-the-art-and-science-of-image-discovery-at-netflix-a442f163af6

https://medium.com/netflix-techblog/artwork-personalization-c589f074ad76

https://mp.weixin.qq.com/s/lZ4FOOVIxsdKvfW45CYCnA

 

您可能會有興趣

留點回應

關於本站

社群氣象台分析與觀察社群上的風暴,預測並且報導社群上的氣象資訊,希望藉由社群大數據的分析,讓企業與個人即時了解社群走向。 本網站以網路時事研究為主,舉凡選舉、生活、鄉民熱議話題、產業資訊、教育、 政策等話題無一不說。歡迎各方相關人士踴躍參與討論。

Copyright © 2016 社群氣象台 All Rights Reserved.