自拍偷在线精品自拍偷|国产无码一区二区久久|最新版天堂资源中文官网|国产精品第一页爽爽影院|国产精品一区二区av不卡|久久久波多野av一区无码|国产欧美日本亚洲精品一4区|亚洲精品天堂在线观看2020

當前位置:首頁 > 軟件開放 > 正文內容

統(tǒng)計代碼如何添加(統(tǒng)計代碼應粘貼到哪里)

軟件開放2個月前 (12-19)207

其實,我們全篇講的是坐音樂推薦的始祖Spotify的音樂推薦系統(tǒng)。

搞懂了這貨的算法,還有啥是你不知道的。

不說廢話了,趕緊上編譯的正文吧。

其實,我們全篇講的是坐音樂推薦的始祖Spotify的音樂推薦系統(tǒng)。

搞懂了這貨的算法,還有啥是你不知道的。

不說廢話了,趕緊上編譯的正文吧。

每個周一,數(shù)億的Spotify用戶會在Spotify上看到一個全新的音樂推薦列表,這是一個包含了30首歌曲的自定義混音專輯,被稱為“Discover Weekly(每周發(fā)現(xiàn))”,這里邊的音樂都是你未曾聽過的,但基本上都是你喜歡的。

我是Spotify的忠實粉絲,尤其是“每周發(fā)現(xiàn)”。為什么這么說?因為它令我覺得它比任何人都更懂得我的音樂口味,每周都會為我推薦喜歡的歌曲,并且都是我自己從來不會發(fā)現(xiàn)的歌曲,每一次都充滿了surprise。

展開全文

Spotify的“每周發(fā)現(xiàn)”播放列表 -具體來說,是我的播放列表。

事實證明,不僅僅只有我自己中了“每周發(fā)現(xiàn)”的毒——很多用戶都癡迷于此,這也促使Spotify徹底重新思考他們的產品焦點,將更多的資源投入到基于算法的推薦播放列表中。

下面是Twitter上兩位網友的說法:

統(tǒng)計代碼如何添加(統(tǒng)計代碼應粘貼到哪里)

Dave(A cenobite) @dave_horwitz:

@Spotify Discover Weekly播放列表對我的了解是如此之深。就像一個以前與我一同經歷過生死考驗的情人一樣。

Amanda Whitbred @amandawhitbred:

在這一點上,@ Spotify的“每周發(fā)現(xiàn)”非常了解我,以至于它推薦的音樂我都會喜歡。

Dave(A cenobite) @dave_horwitz:

@Spotify Discover Weekly播放列表對我的了解是如此之深。就像一個以前與我一同經歷過生死考驗的情人一樣。

Amanda Whitbred @amandawhitbred:

在這一點上,@ Spotify的“每周發(fā)現(xiàn)”非常了解我,以至于它推薦的音樂我都會喜歡。

自從2015年“每周發(fā)現(xiàn)”首次上線以來,我一直醉心于研究它是如何向人們推薦音樂的(加上我是Spotify的狂熱粉絲,所以有時候我喜歡假裝我在那里工作,并且對他們的產品進行研究。)經過三周瘋狂的搜索之后,我終于非常幸運地了解到它背后的原理。

那么Spotify是如何每周為數(shù)億用戶推薦個性化歌曲的呢?讓我們先簡單地看下其他音樂服務是如何完成音樂推薦的,然后再了解Spotify如何更好地做到這一點。

在線音樂推薦的簡史

早在2000年,Songza就開始使用人工推薦的方式進行在線音樂推薦,并為用戶創(chuàng)建播放列表。“人工推薦”意味著一些“音樂專家”或其他推薦人要手動把那些他們認為聽起來不錯的音樂放到同一個播放列表里(后來,Beats Music也采用了同樣的策略)。人工推薦工作是沒錯的,但它需要手動操作,因此無法考慮每位聽眾個人音樂品味的細微差別。

像Songza一樣,Pandora也是音樂推薦的原始玩家之一。它沒有手動標記歌曲的屬性,而是采用了更先進一點兒的方法。即先讓一群人聽音樂,為每個曲目選擇一堆描述性的詞,并用這些單詞把曲目標記起來。然后,Pandora的代碼可以簡單地篩選某些標簽來制作相似音樂的播放列表。

大約在同一時間,來自麻省理工學院媒體實驗室的音樂情報機構“Echo Nest”誕生了,并且提出了一種更加先進的方式進行個性化音樂推薦。Echo Nest使用算法分析音樂的音頻和文本內容,從而得以進行音樂識別,個性化推薦,播放列表創(chuàng)建和分析。

再往后,Last.fm采用了另一種不同的方法,到今天仍然存在,他們使用了叫做協(xié)作過濾的過程來識別用戶可能喜歡的音樂。

(小編注:其實關于協(xié)調過濾算法,熟悉我們平臺的小伙伴應該還會記得在我們之前發(fā)布過一篇文章:亞馬遜“一鍵下單”的背后——個性化推薦系統(tǒng)的發(fā)展歷程)

所以如果上面這些就是其他音樂推薦服務的做法,那Spotify是怎樣實現(xiàn)神乎其技的推薦引擎,并且似乎比任何其他服務都更準確地戳中了個人用戶的口味的呢?

Spotify的3種推薦模型

Spotify實際上并沒有使用一個革命性的推薦模型,而是將其他服務使用的一些最佳策略混合在一起,從而創(chuàng)建自己獨特而又強大的發(fā)現(xiàn)引擎。

為了創(chuàng)建“每周發(fā)現(xiàn)”,Spotify采用以下三種主要類型的推薦模型:

協(xié)作過濾模型(即Last.fm最初使用的模型),通過分析您的行為和其他人的行為來工作。

自然語言處理(NLP)模型,通過分析文本工作。

音頻模型,通過分析原始音軌本身進行工作。

圖片來源:Chris Johnson,Spotify

下面,讓我們來深入了解這些推薦模式的運作方式!

推薦模型#1:協(xié)同過濾

首先需要了解一些背景:當許多人聽到“協(xié)同過濾”這個詞時,他們首先想到的是Netflix,因為他們是首先使用協(xié)作過濾來構建推薦模型的公司之一。他們通過使用用戶的星級電影評分來了解該把什么電影推薦給其他相似的用戶。

在Netflix將“協(xié)同過濾”成功應用之后,這個算法的使用速度迅速擴大,現(xiàn)在通常被認為是任何想要構建推薦模型的人的入門算法。

不像Netflix,Spotify沒有讓用戶對音樂進行星級評價。相反,Spotify所用的數(shù)據(jù)是隱含的反饋 -具體來說,我們收聽的曲目的流數(shù),以及額外的流數(shù)據(jù),包括用戶是否將曲目保存到自己的播放列表中,或者在收聽后訪問了歌手頁面等等。

但是什么是協(xié)同過濾呢,它是如何的發(fā)揮作用的呢?這是一個更高層的抽象,我們現(xiàn)在把它畫在下面的這張圖里:

Image by Erik Bernhardsson

看懂這張圖了嗎?這兩個人中的每一位都有一些音樂的偏好 -左邊的人喜歡音樂P,Q,R和S;右邊的人喜歡音樂Q,R,S和T.

通過協(xié)同過濾對數(shù)據(jù)分析后,初步得出這樣的結論:

嗯。你們都喜歡三首相同的音樂——Q,R和S ——所以你們可能是類似的用戶。因此,你們每個人都有可能喜歡另一個人聽過而你還沒聽過的其他曲目。

因此,我們建議右邊的那個人聽一下歌曲P,左邊的那個人聽一下音樂T。很簡單,對吧?

但Spotify是如何在實際操作中使用這一概念來根據(jù)數(shù)百萬其他用戶的偏好計算他們的的建議曲目的呢?

…數(shù)學矩陣,用Python庫就能完成!

實際上,上圖的這個矩陣是非常巨大的。每一行都代表Spotify的1.4億用戶之一(如果您使用Spotify,您可以想象,自己就是此矩陣中的一行),并且每列代表Spotify數(shù)據(jù)庫中的3000萬首歌曲之一。

然后,Python庫會運行這個漫長而復雜的矩陣分解公式:

一些復雜的數(shù)學

計算完成時,我們就會得到被X和Y表示的兩種類型的向量。其中X是用戶向量,表示單個用戶的口味,Y是表示單個歌曲的資料的歌曲向量。

用戶/歌曲矩陣產生兩種類型的向量:用戶向量和歌曲向量。

現(xiàn)在我們有1.4億個用戶向量 -每個用戶就是其中一行 -以及3000萬個歌曲向量。這些向量的實際內容只是一堆數(shù)字,它們本身是無意義的,但把它們相互一比較就非常有意義了。

要找到哪些用戶的口味和我最相似,協(xié)作過濾算法會將我的向量與所有其他用戶的向量進行比較,最終揭示與我最相似的用戶。Y向量也是一樣,歌曲 -您可以將歌曲的矢量與所有其他歌曲矢量進行比較,并找出哪些歌曲與您正在查看的歌曲最相似。

(編輯注:而至于如何比較相似度,讀者還可以參考知乎上這篇和網易云歌單推薦算法有關的萬贊回答,網易云音樂的歌單推薦算法是怎樣的?邰原朗的回答--http://s.ai100.com.cn/8v)

協(xié)同過濾算法的效果其實已經相當不錯了,但Spotify為了做得更好還添加了另一個推薦引擎——NLP。

推薦模型#2:自然語言處理(NLP)

Spotify采用的第二種推薦模型是自然語言處理(NLP)模型。這些模型的源數(shù)據(jù),顧名思義,是常規(guī)的字詞 –歌曲元數(shù)據(jù),新聞文章,博客和互聯(lián)網上的其他文字。

自然語言處理 –代表了計算機理解人類語言的能力 -是一個龐大的領域,通過情感分析API來實現(xiàn)。

NLP背后的確切機制超出了本文的范圍,并且下面我們介紹的這些場景都是在很高層次上發(fā)生的事情:Spotify會不斷地瀏覽網頁,不斷尋找和音樂有關的博客或其他書面文字,了解人們對特定的藝術家和歌曲談論的內容——即對這些歌曲經常使用什么形容詞和語言,還會討論哪些其他藝術家和歌曲。

雖然我不知道Spotify如何選擇處理其數(shù)據(jù)的細節(jié),但我可以告訴您Echo Nest如何與之合作。他們會把它們搜集到他們所謂的“文化向量”或“根詞匯”中。每個藝術家和歌曲都有數(shù)以千計并且每天都在更新的“根詞匯”。每個詞都有一個權重相關聯(lián),它揭示了描述的重要性(粗略地說,權重代表了人們用這個詞描述音樂的概率)。

Echo Nest使用的“文化向量”或“根詞匯”。表格來自Brian Whitman

然后,就像協(xié)同過濾算法一樣,NLP模型使用這些詞匯和權重來創(chuàng)建歌曲的向量表示,可以用來確定兩段音樂是否相似。聽起來酷斃了,是不是?

推薦模型#3:原始音頻模型

這里有個問題,首先,你可能會在想:但是,親愛的,我們已經從前兩個模型里搜集到了這么多數(shù)據(jù)!為什么還要在費勁兒分析音頻本身呢?

嗯…首先,加上第三個模型可以進一步提高這個推薦服務的準確性。但實際上,使用這種模型還考慮到一個次要目的:與前兩種模型類型不同,原始音頻模型可以用來發(fā)現(xiàn)新歌曲。

例如,你的歌手-作曲家朋友在Spotify上傳了一首歌曲,但可能只有50個聽眾,所以很少有其他聽眾通過協(xié)同過濾算法發(fā)現(xiàn)它。它也沒有在互聯(lián)網上的任何地方被提到,所以NLP模型也不會接受它。幸運的是,原始音頻模型并不會在意一首歌到底是新的曲目還是流行的曲目,所以在這個算法的幫助下,你朋友的歌曲就可以和其他流行歌曲一起被選擇出現(xiàn)在Discover Weekly的播放列表里!

好,解決了為什么的問題,現(xiàn)在我們來探究一下它的原理——我們如何分析原始的音頻數(shù)據(jù),這似乎聽起來很抽象。

方法就是卷積神經網絡!

卷積神經網絡就是面部識別背后的支撐技術。但在Spotify中,它們被進行了相應的修改,以處理音頻數(shù)據(jù),而不再是圖像數(shù)據(jù)。下圖是一個神經網絡架構的例子:

圖片來源:Sander Dieleman

這個特定的神經網絡有四個卷積層,即左邊的四個寬條,和三個全連接層,即右邊的三個窄條。輸入是音頻幀的時間-頻率表示,然后將它們進行級聯(lián)以形成頻譜圖。

音頻幀通過這些卷積層,在最后一個卷積層之后,您可以看到一個“全局時序池化”層,它對整個時間軸進行池化,可以有效地計算歌曲整個時間內學習到的特征的統(tǒng)計。

在處理之后,神經網絡會輸出對歌曲的分析結果,包括像估計的拍子記號,調,模式,速度和響度等特征。以下是Daft Punk樂隊的作品“Around the World”30秒摘錄的數(shù)據(jù)。

圖片來源:Tristan Jehan和David DesRoches(The Echo Nest)

最終,對這首歌曲的主要特征的分析使得Spotify能夠了解歌曲之間的基本相似之處,從而使得用戶可以基于自己的播放歷史欣賞相似的歌曲。

下面這張圖涵蓋了為推薦管道提供的三種主要類型的推薦模型的基礎知識,并最終為“每周發(fā)現(xiàn)”播放列表提供建議!

當然,這些推薦模型最終都要連接到Spotify的更大的生態(tài)系統(tǒng)中,其中包括大量的數(shù)據(jù)存儲,使用大量的Hadoop集群來擴展建議,并使這些算法引擎對巨型矩陣,無盡的互聯(lián)網音樂文章和大量的音頻文件進行計算。

作者:Sophia Ciocca,軟件工程師,作家。

掃描二維碼推送至手機訪問。

版權聲明:本文由飛速云SEO網絡優(yōu)化推廣發(fā)布,如需轉載請注明出處。

本文鏈接:http://m.thonggone.com/post/125537.html

分享給朋友:

“統(tǒng)計代碼如何添加(統(tǒng)計代碼應粘貼到哪里)” 的相關文章

手機軟件開發(fā)(手機軟件開發(fā)app需要學什么)

手機軟件開發(fā)(手機軟件開發(fā)app需要學什么)

本篇文章給大家談談手機軟件開發(fā),以及手機軟件開發(fā)app需要學什么對應的知識點,希望對各位有所幫助,不要忘了收藏本站喔。 本文目錄一覽: 1、在手機上如何開發(fā)一個APP 2、開發(fā)一個手機APP需要學什么知識? 3、軟件開發(fā)工作具體干什么? 4、如何開發(fā)手機app 在手機上如何開發(fā)一個AP...

做個app的費用大概多少(做個app得多少錢)

做個app的費用大概多少(做個app得多少錢)

今天給各位分享做個app的費用大概多少的知識,其中也會對做個app得多少錢進行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關注本站,現(xiàn)在開始吧!本文目錄一覽: 1、做一個APP要花多少錢? 2、開發(fā)一款app需要多少成本? 3、制作一個app需要多少錢? 4、開發(fā)一個app需多少錢 做...

同花順免費炒股軟件下載(同花順炒股軟件下載網址)

同花順免費炒股軟件下載(同花順炒股軟件下載網址)

本篇文章給大家談談同花順免費炒股軟件下載,以及同花順炒股軟件下載網址對應的知識點,希望對各位有所幫助,不要忘了收藏本站喔。 本文目錄一覽: 1、想請問,同花順炒股軟件去哪里下? 2、買股票應該下載什么軟件最好? 3、炒股軟件app排名 4、同花順手機炒股軟件怎么樣? 5、同花順股票分...

碼上放心追溯碼用什么掃(碼上放心追溯碼什么意思)

碼上放心追溯碼用什么掃(碼上放心追溯碼什么意思)

本篇文章給大家談談碼上放心追溯碼用什么掃,以及碼上放心追溯碼什么意思對應的知識點,希望對各位有所幫助,不要忘了收藏本站喔。 本文目錄一覽: 1、藥品追溯碼為什么印淘寶掃一掃? 2、碼上放心的二維碼可以手動輸入掃碼槍嗎 3、碼上放心子類監(jiān)管碼在那里查 藥品追溯碼為什么印淘寶掃一掃? 親,很高...

2萬粉絲一天收入(1萬粉絲一天收入)

2萬粉絲一天收入(1萬粉絲一天收入)

本篇文章給大家談談2萬粉絲一天收入,以及1萬粉絲一天收入對應的知識點,希望對各位有所幫助,不要忘了收藏本站喔。 本文目錄一覽: 1、抖音上有2千萬粉絲可以賺多少錢 2、162萬粉絲看直播2萬人,一月收入多少 3、抖音二萬多粉絲能賣多少錢 4、抖音粉絲二千萬收入多少 5、兩萬粉絲快手號...

168開獎極速賽車騙局全過程(168極速賽車開獎的視頻)

168開獎極速賽車騙局全過程(168極速賽車開獎的視頻)

本篇文章給大家談談168開獎極速賽車騙局全過程,以及168極速賽車開獎的視頻對應的知識點,希望對各位有所幫助,不要忘了收藏本站喔。 本文目錄一覽: 1、極速賽車的技巧怎么玩? 2、168極速賽車是哪個國家的 3、極速賽車買前5名的方法 4、168極速賽車來源于哪個國家 5、極速賽車有...