三步驟,使用遺傳算法分析流量變化的原因
當遇到異常流量變化時,分析師或產品經理通常需要放下工作,立即調查原因。
但是,在此過程中,通常需要三步驟:
1,發現異常流量特性
2。凈化異常流量
3。分析異常流量的原因
第一步是發現異常流量。為了提高這項工作的效率,我總結了一套清單,希望能作為你的工作手冊。我將首先列出列表中的項目,然后詳細解釋它們:
一、異常流量尺寸快速檢查表
1.兩天一小時比較異常和正常,分別比較紫外/會話/光伏和其他指標
2.如果有其他交通統計系統,請相互驗證數據的準確性。
如果單個小時流量發生顯著變化:
3.確定異常時間段,并找到技術部的同事調查問題(如有可能,先關注域名報告中問題頁面的某一部分,所有頁面和內容分組報告,方法見下文)
4.查找運行維護部門的同事,找出異常期間的http請求數量是否異常(如果是,則表示流量實際發生了變化;如果不是,統計代碼本身可能有問題,實際流量沒有改變)
5.請聯系產品/運營同事,詢問是否有任何產品修訂或組織了哪些在線活動。
6.如果異常在每小時內均勻分布,則有必要檢查每個維度中是否有任何顯著異常的項目,這可能是問題點:
流動來源
新/舊用戶
登錄頁面
所有頁面(組)
事件
省/市
瀏覽器/操作系統
手機品牌/型號(手機訪客)
互聯網運營商
二,常見三異常

1。懸崖類型:衰退時期如此明顯。接下來,我們可以直接轉到域名或所有頁面報告,輕松找到下落的頁面,然后轉到技術和運營同事那里檢查問題。
2,個別小時的小振幅異常

與明顯的懸崖下降相比,如果只懷疑下降了幾個小時,就不容易找到下降的域名/頁面,因為丟失的流量被一整天的數據“稀釋”。但幸運的是,遺傳算法有強大的高級分割功能,我們可以單獨查看下降時間的數據。這個過程就是本文開頭提到的“異常流量的凈化”:

在進行了高級別細分并查看域名報告后,我們可以清楚地找到下降部分:

找到異常域名后,將在二級維度中調用登錄頁面,以便更準確地找到有問題的頁面:

其他交通統計系統也可以具有類似的細分功能。簡而言之,思路是一樣的,即找到異常維數,然后將其作為細分條件提取問題最集中的部分流量。
3,全天候均勻下降
有時問題維度不是小時,例如,以下示例:
我們發現來自so.com源的流量明顯減少,但在小時維度數據上分布相對均勻:


所以這次我們不按小時細分,而是建立一個“so.com源”的細分,完成異常流量的“凈化”,然后我們將分析異常的原因。這一過程實際上很簡單,只要你對“凈化”進行高級細分,并在各種報告中尋找其他維度的異常。


結果,我們在“瀏覽器”報告中發現,只有Vivo系統的瀏覽器數據發生了很大變化,然后我們繼續用二次維度細分瀏覽器帶來的流量源。結果發現,隨著so.com來源的減少,百度的流量基本上在同一水平上增加,原因是顯而易見的。很有可能瀏覽器切斷了原本通往百度搜索框中so.com的流量。
三,分析系統之外還有什么
前一篇文章中的方法可以處理大多數流量異常,但是如果異常數據在任何維度上均勻分布,如果找不到異常點怎么辦?此時,您可以首先打開網站/應用程序并查看。有時問題很容易在那里找到。
此外,我們還可以考慮外部因素,如因學生開學而導致游戲相關流量下降,因周末趕上各種嚴重霧霾天氣而導致娛樂流量上升(用戶都在家),甚至我們的品牌出現在“聚焦”鏡頭中,導致游客流量激增。沒有找到這些外部因素的明確規則,找到它們要靠一點運氣。
關于作者:卡車家庭數據資產中心主任孫偉在互聯網上工作了15年,在數據分析方面工作了6年。谷歌分析高級用戶,博客“數據分析日報”公開號碼。
相關閱讀:
[在廣告中,我會教你如何發現交通作弊]點擊查看
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。
