你剛在微信和朋友討論AJ款式,看公眾號(hào)就刷到了AJ的廣告,淘寶首頁也驚喜般地出現(xiàn)了AJ推薦;晚上刷抖音總是刷個(gè)不停,感覺刷到的每一個(gè)視頻都有某個(gè)點(diǎn)能戳中自己,你陷入尋找刺激的循環(huán)。
為什這些APP都知道你在想要什么且清楚你的興奮點(diǎn),是他們監(jiān)控你的聊天記錄?
不,是你的個(gè)人基礎(chǔ)信息和行為數(shù)據(jù)告訴了他們你需要這些,他們就把你的需要主動(dòng)給到你罷了。
那他們是怎么做到的呢?下面我們就來簡單探討下個(gè)性推薦。這里是文章的結(jié)構(gòu)圖,圖和文章可以對照看,方便理解。
首先,個(gè)性推薦系統(tǒng)是為了解決信息過載,通過個(gè)性化推薦提高信息分發(fā)的效率和準(zhǔn)確性,使得用戶更有粘性而被廣泛使用的系統(tǒng)。通俗的說他就是為了讓你更爽,你要什么我就給你什么。
這很美好,但這里有一個(gè)陷阱,意思是你不要什么我就少點(diǎn)給你或者不給你——你也就失去了與你意見相左的知識(shí)領(lǐng)域接觸的機(jī)會(huì),單一的內(nèi)容被推薦多了用戶也會(huì)感到疲勞。
個(gè)性推薦用在電商領(lǐng)域來說應(yīng)該叫“精準(zhǔn)投放”——你想買什么淘寶就推薦給你什么,這像是雙贏的感覺。
但對于內(nèi)容領(lǐng)域(短視頻等)來說,只推薦你有興趣的內(nèi)容,刺激你興奮點(diǎn)的同時(shí)也讓你接觸世界的邊界越來越窄,沉浸于自己營造的狹小的世界;難道我們進(jìn)入這種回音室的怪圈之后就無法破解了嗎?
(回音室效應(yīng):一些意見相近的聲音不斷重復(fù),令身處其中的多數(shù)人認(rèn)為這些聲音就是事實(shí)的全部。)我們先不急著解答,待我們逐步探討下個(gè)性推薦的內(nèi)容后,自己就能解答以上的問題;
獨(dú)立因素推薦
獨(dú)立因素推薦,就是推薦系統(tǒng)基于單個(gè)因素篩選的內(nèi)容或商品推送給用戶;我們在了解獨(dú)立因素推薦的同時(shí)也了解下推薦的兩種模式被動(dòng)推薦和主動(dòng)推薦;
被動(dòng)推薦
推薦是用戶被動(dòng)的接收信息,需要用戶去觸發(fā)而產(chǎn)生的推薦結(jié)果。
例如淘寶上用戶依據(jù)價(jià)格區(qū)間的獨(dú)立因素篩選商品,這種行為完全依據(jù)用戶有意識(shí)的自主操作告訴淘寶我需要特定獨(dú)立因素的商品,淘寶后臺(tái)會(huì)依據(jù)你的輸入信息進(jìn)而對前端的你進(jìn)行反饋。
假如用戶不是選一個(gè)因素而是同時(shí)選擇價(jià)了格區(qū)間+發(fā)貨地區(qū)+品牌這三個(gè)獨(dú)立因素時(shí),這時(shí)后臺(tái)進(jìn)行篩選,把同時(shí)具備這幾個(gè)獨(dú)立因素的商品推薦給用戶,這只是多個(gè)獨(dú)立因素的簡單物理標(biāo)簽相的加可以說還是屬于獨(dú)立因素推薦的范疇。(當(dāng)然淘寶真實(shí)推薦結(jié)果更為復(fù)雜,因?yàn)橛猩唐犯們r(jià)排名,這些都會(huì)影響推薦的結(jié)果,目前是舉例說明)
與之類似的還有網(wǎng)易云音樂的歌單廣場,歌單廣場將歌單分為了流行、民謠、電子等不同的類別,每一個(gè)類別就是一個(gè)因素,用戶選擇哪個(gè)因素的標(biāo)簽,后臺(tái)系統(tǒng)就更新屬于該因素的歌單的數(shù)據(jù)給到前端界面上展示,這類都是獨(dú)立因素的被動(dòng)推薦。
主動(dòng)推薦
主動(dòng)推薦,由系統(tǒng)定時(shí)更新數(shù)據(jù)并主動(dòng)推薦到用戶面前,用戶打開界面就能接觸到主動(dòng)推薦的結(jié)果;如網(wǎng)易云音樂的熱歌榜,抖音的人氣熱搜榜等就是主動(dòng)推薦的方式。
但這種熱榜這種統(tǒng)一推薦的方式有一定程度的成馬太效應(yīng)——火的內(nèi)容會(huì)得到更多的曝光越來越火,但大部分人喜歡的內(nèi)容并不帶代表每一個(gè)用戶都是喜愛的,熱門推薦滿足用戶從眾心理的同時(shí)也忽略了用戶的個(gè)性差異體驗(yàn),所以就需要依據(jù)用戶個(gè)性的推薦來彌補(bǔ),隨著用戶對自我獨(dú)特性的感知越來越強(qiáng),需要個(gè)性化定制的需求也越來越明顯。如何讓特定的內(nèi)容滿足特定的用戶,讓用戶開開心心的走進(jìn)個(gè)性推薦的陷阱里就是接下來我們要講的重點(diǎn)。
融合因素推薦
融合因素推薦就是將幾個(gè)不同的因素依據(jù)特定算法融合而產(chǎn)生新的屬性標(biāo)簽,并推薦到與該屬性標(biāo)簽匹配的用戶手機(jī)上。我們把融合因素推薦分為基于內(nèi)容本身屬性推薦、基于內(nèi)容屬性與用戶屬性協(xié)同推薦、基于相似用戶協(xié)同推薦這三種推薦方式。
基于內(nèi)容本身屬性推薦(推薦對象一般是所有人)
還是以抖音熱門短視頻為例,我們需要做的是依據(jù)內(nèi)容的本身屬性建立內(nèi)容畫像,用數(shù)據(jù)模型來表示內(nèi)容的特征。
由抖音熱搜榜可看到,我們把點(diǎn)贊數(shù)排名在前30的視頻放上熱搜榜。
當(dāng)然決定點(diǎn)贊數(shù)的因素除了視頻內(nèi)容本身的類型及質(zhì)量外,很大的關(guān)鍵還在于平臺(tái)給多少人推薦了這個(gè)視頻,即有多少人可以刷到了這個(gè)視頻。平臺(tái)判斷一個(gè)視頻是否值得推薦給更多的用戶群體,又與歷史用戶對視頻的交互行為息息相關(guān)。
例如:
短視頻平臺(tái)將一個(gè)審核過后的新視頻先推薦給10w人的基礎(chǔ)用戶池進(jìn)行播放展示,如果這10w人有很多人進(jìn)行完全播放、點(diǎn)贊、評(píng)論、轉(zhuǎn)發(fā)等操作,平臺(tái)就判斷該視頻為優(yōu)質(zhì)內(nèi)容進(jìn)而推薦給100w、1000w的用戶池如此類推。
如果該視頻在10w的展示量中大部分用戶對該視頻不感冒,很少播放完或點(diǎn)贊,就會(huì)減少該視頻的展示量或不會(huì)再推薦給更多的用戶。
這形成一個(gè)優(yōu)質(zhì)內(nèi)容能得到更多展示劣質(zhì)內(nèi)容減少展示的良性循環(huán)。(用戶池也分不同種類的用戶池,舉例用非真實(shí)數(shù)據(jù))
這樣判斷一個(gè)視頻能否進(jìn)入到下一個(gè)用戶池的標(biāo)準(zhǔn)就成為了關(guān)鍵,現(xiàn)實(shí)中這個(gè)標(biāo)準(zhǔn)是根據(jù)模型動(dòng)態(tài)變化的,現(xiàn)在我們先進(jìn)行標(biāo)準(zhǔn)的性靜態(tài)分析這樣便于理解;根據(jù)下面初級(jí)的算法公式可看到一個(gè)視頻的優(yōu)質(zhì)程度與用戶對這個(gè)視頻的喜愛程度成正比,我們先用用戶的喜愛程度這個(gè)特性來反應(yīng)視頻的優(yōu)質(zhì)程度。
視頻優(yōu)質(zhì)度=用戶喜愛度 X 視頻質(zhì)量基數(shù) X 題材類別基數(shù) X 平臺(tái)廣告基數(shù)
影響用戶喜愛程度的獨(dú)立因素有用戶對視頻的平均播放時(shí)長、點(diǎn)贊、評(píng)論、分享、關(guān)注以及不感興趣等操作,每一個(gè)操作都會(huì)為一個(gè)獨(dú)立因素增加數(shù)值;而且每個(gè)獨(dú)立因素對與平臺(tái)判斷用戶對視頻的喜愛程度的重要性是不同的,如,分享>評(píng)論>點(diǎn)贊。我們用權(quán)重來表示,對喜愛度高的因素進(jìn)行數(shù)據(jù)加權(quán),數(shù)據(jù)加權(quán)一般有兩種常用方式;
自定義加權(quán)
產(chǎn)品經(jīng)理、運(yùn)營經(jīng)理依據(jù)平時(shí)的數(shù)據(jù)報(bào)表人為的定義這些獨(dú)立因素和設(shè)置權(quán)重因子的數(shù)值,這種方式比較直接也比較簡單,但他局限于團(tuán)隊(duì)的自身經(jīng)驗(yàn),沒有經(jīng)過大數(shù)據(jù)的驗(yàn)證與現(xiàn)實(shí)還是有較大的偏差。
數(shù)據(jù)建模
數(shù)據(jù)建模簡單的說就是將時(shí)間變量、獨(dú)立因素、權(quán)重因子通過特定的算法公式進(jìn)行計(jì)算得出該視頻的一個(gè)優(yōu)質(zhì)度數(shù)值。根據(jù)這個(gè)數(shù)值進(jìn)行推薦和排名,隨著時(shí)間變量的改變,獨(dú)立因子、甚至是權(quán)重因子也會(huì)依據(jù)一定的函數(shù)關(guān)系進(jìn)行改變,整個(gè)模型的輸入和輸出都是動(dòng)態(tài)變化的,而且我們不斷的采集用戶行為數(shù)據(jù)用來訓(xùn)練模型使其更加接近現(xiàn)實(shí)預(yù)測的數(shù)值。
基于以上信息我們就可以粗劣的得出一張反映用戶對視頻喜愛程度的參考表,該表也可以反映出視頻的優(yōu)質(zhì)程度;
用戶喜愛度=(播放時(shí)長量+點(diǎn)贊量+評(píng)論量+分享量 – 不感興趣量+…)X 權(quán)重因子 X 衰減因子
(正常情況下,需要對各個(gè)指標(biāo)做線性方程回歸分析,確定各個(gè)指標(biāo)具有獨(dú)立性后,再做權(quán)重分析,以上面表格是非真實(shí)數(shù)據(jù))
根據(jù)以上思路我們可以對視頻進(jìn)行優(yōu)質(zhì)程度和類型的評(píng)定,有了內(nèi)容畫像現(xiàn)在只需找到對這個(gè)視頻內(nèi)容感興趣的用戶把視頻推送給他就行了,下面就是我們要說到的基于內(nèi)容屬性與用戶屬性的協(xié)同的推薦。
基于內(nèi)容屬性與用戶屬性協(xié)同推薦(推薦給特定屬性的人)
我們通過采集一個(gè)人的基礎(chǔ)信息和行為數(shù)據(jù)來對一個(gè)用戶做定性分析,得出一個(gè)用戶在互聯(lián)網(wǎng)及現(xiàn)實(shí)中的各種特征,所有特征整合在一起就成為一個(gè)代表現(xiàn)實(shí)中用戶的虛擬畫像。
構(gòu)建用戶畫像數(shù)據(jù)會(huì)用到靜態(tài)和動(dòng)態(tài)兩類數(shù)據(jù):
1.靜態(tài)用戶畫像數(shù)據(jù)
我們在注冊APP時(shí)通常會(huì)輸入姓名、年齡、性別、允許獲取位置、這些基礎(chǔ)信息相對穩(wěn)定。
2.動(dòng)態(tài)用戶畫像數(shù)據(jù)
用戶在平時(shí)生活對手機(jī)產(chǎn)生的操作行為,如你玩過的游戲、關(guān)注的公眾號(hào)、消費(fèi)記錄,有沒有房貸車貸發(fā)過紅包買過保險(xiǎn),這些行為最后都會(huì)變成幾千個(gè)事實(shí)標(biāo)簽,用這些事實(shí)標(biāo)簽構(gòu)建模型計(jì)算用戶的行為偏好。
(圖片來源于回形針PaperClip)
還是用上面提到的用戶對視頻的喜愛度的情況為例。
當(dāng)用戶刷抖音看到一個(gè)標(biāo)簽為美女類的視頻點(diǎn)了一個(gè)贊,并不意為者該用戶就喜歡看美女可能是不小心點(diǎn)的,這就需要更多的行為來判斷該用戶對美女類視頻的喜愛程度;根據(jù)前面提到的初級(jí)公式:
對美女的喜愛權(quán)重=(播放時(shí)長量+點(diǎn)贊量+評(píng)論量+分享量 – 不感興趣量+…)X 權(quán)重因子 X 衰減因子
除了點(diǎn)贊、評(píng)論、分享,關(guān)注了某作者這些行為外還有一個(gè)時(shí)間的限定,短期行為無法代表長期興趣,單次行為的權(quán)重會(huì)隨著時(shí)間流逝不斷衰減,用戶每次打開美女類內(nèi)容都會(huì)生成一個(gè)興趣權(quán)重,把一段時(shí)間內(nèi)你所有的美女類興趣權(quán)重進(jìn)行累加,再用S型函數(shù)標(biāo)準(zhǔn)化就能得到一個(gè)0-10區(qū)間的興趣值,標(biāo)簽值數(shù)值越高,就代表用戶對美女就越感興趣程度。
到了這里平臺(tái)已可以計(jì)算出用戶對某一類視頻的喜愛程度和厭惡程度,同時(shí)也對視頻做了分類處理,可直接根據(jù)用戶的偏好將視頻推薦給用戶。
平臺(tái)除了可以計(jì)算出用戶在內(nèi)容興趣上面的權(quán)重外還可以在消費(fèi)能力、社交偏好等方向進(jìn)行建模計(jì)算,進(jìn)而得出一個(gè)交為完整的用戶畫像。
另外通過行為直接推薦視頻的效果往往不如通過同類視頻推薦,找到和你一樣的人,把他們的瀏覽記錄推薦給你,往往比直接猜你喜歡什么效果更好!
基于相似用戶協(xié)同推薦(人以群分)
如何找到和你一樣的人
根據(jù)以上思路,我們在用戶的美女喜愛偏好權(quán)重、社交偏好權(quán)重、消費(fèi)能力權(quán)重等多個(gè)維度建立模型,計(jì)算用戶的偏好,之后將這些偏好反映的權(quán)重值轉(zhuǎn)化為特征向量!
如,我們把用戶對美女的喜愛權(quán)重為8,社交偏好權(quán)重為5,消費(fèi)能力權(quán)重為2,將向量理解成多維空間上的一個(gè)坐標(biāo),通過把每個(gè)用戶的向量坐標(biāo)代入余弦公式和距離公式中,就能計(jì)算出和你相似的人,進(jìn)而把用戶分類。
(這里用到的是鄰近技術(shù):利用用戶的歷史喜好信息計(jì)算用戶之間的距離空間中的點(diǎn)越近越相似。)
這樣廣告主或平臺(tái)就可以依據(jù)與你相似群體的消費(fèi)記錄和喜愛偏好給你推薦商品或視頻,這也恰巧就是你喜歡的類型。
需要說明的是,微信淘寶們采集的行為數(shù)據(jù)不僅僅對應(yīng)你的賬號(hào),更與你的手機(jī)唯一識(shí)別碼綁定在一起,這意味著你就算不注冊不登陸,你的行為數(shù)據(jù)一樣會(huì)被采集。同時(shí)廣告平臺(tái)也可以根據(jù)你的手機(jī)識(shí)別碼在其他APP上為你投放廣告,這樣你在刷抖音的時(shí)候也能看到淘寶的AJ廣告了!
總的來說,你的一切上網(wǎng)行為都會(huì)在手機(jī)上留下操作的痕跡(基礎(chǔ)信息和行為數(shù)據(jù))。平臺(tái)采集到這些歷史痕跡進(jìn)行數(shù)據(jù)清洗——結(jié)構(gòu)化數(shù)據(jù)——建模分析,計(jì)算出你的行為偏好,根據(jù)你的偏好或同類人的偏好向你推薦商品和內(nèi)容。
這也就是為什么你剛在微信和朋友討論AJ款式,刷公眾號(hào)就刷到了AJ的廣告,淘寶首頁也驚喜般的出現(xiàn)了AJ推薦;晚上刷抖音總是刷個(gè)不停,感覺刷到的每一個(gè)視頻都有某個(gè)點(diǎn)能戳中自己;
那么陷入回音室的怪圈又是怎么回事呢?(回音室怪圈:只推薦你有興趣的內(nèi)容,讓你接觸世界的邊界越來越窄,沉浸于自己營造的狹小的世界)
回音室怪圈的陷阱是我們自己挖的
由個(gè)以上個(gè)性化推薦機(jī)制的流程可知,你現(xiàn)在的行為數(shù)據(jù)將決定你將來會(huì)接收到什么樣的內(nèi)容,從這個(gè)角度看個(gè)性化推薦的結(jié)果完全取決于你自己本身的傾向。
如果你刷抖音時(shí)能包容那些和你意見不同的人,能耐心看完或評(píng)論互動(dòng),那么根據(jù)個(gè)性推薦的機(jī)制,你的內(nèi)容信息流中既有自己喜歡的內(nèi)容也會(huì)有自我認(rèn)知之外的內(nèi)容,不用擔(dān)心個(gè)性化推薦會(huì)把你留在回音室里面。
相反,如果你只接受那些你認(rèn)同的意見或人,不能包容異己,將與自己觀點(diǎn)不對等的內(nèi)容拉黑處理,長此以往你的信息流里就會(huì)只剩下你喜歡的內(nèi)容,沉浸在自己打造的回音室里。
個(gè)性推薦只是依據(jù)你的習(xí)慣做出的推薦結(jié)果,讓你掉進(jìn)回音室怪圈里的還是你自己。
本文由今科科技用戶上傳并發(fā)布,今科科技僅提供信息發(fā)布平臺(tái)。文章代表作者個(gè)人觀點(diǎn),不代表今科科技立場。未經(jīng)作者許可,不得轉(zhuǎn)載,有涉嫌抄襲的內(nèi)容,請通過 反饋中心 進(jìn)行舉報(bào)。
售前咨詢:0760-2332 0168
售后客服:400 830 7686
1998~2024,今科26年專注于企業(yè)信息化服務(wù)
立 即 注 冊 / 咨 詢
上 線 您 的 網(wǎng) 站 !