如今的搜索引擎不僅需要提供用戶想要的信息,還要猜到用戶想要什么。
瘋狂原始人、鋼鐵俠、中國合伙人、致青春……互聯網時代,想找一部電影看看,隨便一個搜索引擎通常都能幫到你。但,當你不知道自己想要什么,或是沒法準確描述出來“要什么”時,該找誰幫忙呢?
一種電影系統推薦算法或許可以。日前,百度舉辦了首屆“電影推薦系統算法創新大賽”,來自清華、北大等全國100多所高校1000多名參賽同學利用百度給出的數據集,用不同算法實現了線上“私人電影院”的構想。
以主動發現用戶需求為特征的推薦引擎伸向了視頻領域,這意味著,當你還未主動發出觀看電影或視頻的信號時,你喜歡的內容就已經呈現在你面前。
要把這個過程變為現實并不輕松。“它是通過大量計算和分析得來的結果。”指導參賽選手進行視頻推薦引擎開發的百度垂直搜索部資深研發工程師胡一川說,“要根據用戶的行為去分析、了解用戶的興趣,然后把他感興趣的東西給他。這樣的話,每個人來這個網站,看到的東西都是不同的。”
百度目前的產品“今晚看啥”采用的是混合推薦的算法。用戶的觀看歷史記錄、評分記錄、觀看時長和時間地點以及社交關系等數據都被搜集起來,意在建立一套完整的個性化推薦算法,真正為用戶實現個性化定制。
電影推薦系統的實現,可以聯系用戶和信息,一方面幫助用戶發現對自己有價值的信息,另一方面讓信息能夠展現在對他感興趣的人群中,從而實現信息提供商與用戶的雙贏。
胡一川說,以前是一搜即得,但以后用戶不用搜索,甚至不用登陸百度賬號,百度視頻的首頁就會給你提供完全的個性化視頻推薦,匿名推薦。
談到比賽本身的意義,百度個性化推薦部門的相關負責人認為,比賽很好地體現了學術比賽與工程產品在思路上的差異和共同點。
一些簡單通用、在不同規模數據集上都表現較好的模型是學術和工業界都非常關注的;而另外一些學術界和學術比賽中關注較多的數據集,在實際工程中卻使用較少,這一部分是值得研發人員去調研嘗試的,對為用戶推薦更好的產品有很大的意義。比賽也發現和鍛煉了一批潛力較好的同學,無論是對企業還是對行業發展都是很有價值的。