如何從0開始學習商業資料分析,有哪些基礎的東西需要了解?

如何從0開始學習商業資料分析,有哪些基礎的東西需要了解?Choi女士的精緻日記2019-10-24 22:24:24

很多公司的招聘,都會明顯寫著需要有資料分析的能力,當然啦,大部分的求職者都很懂事,也會在自己的簡歷上加上“精通資料分析”等字樣。

一旦遇到一些有質量的面試官,問了幾個問題之後,大家會心一笑,基本就知道你資料能力的真偽了。事實上很多求職者,連最基本的概念,也沒有搞清楚。

這個時候,市面上的教育產品也很懂事,知道現在企業增長難,難於上青天,都在狠抓資料增長,所以出品了一套又一套,一堂又一堂的資料教學課程。

正所謂,磨刀不誤砍柴工,在你瞭解高階深入的資料課程之前,我覺得你很有必要先把以下這七個基本概念搞清楚。

畢竟有時候,越基礎的東西,越接近於事物的本質。

01

數字和陣列

看數字,看的是一個結果,這是一個滯後性的指標型別,任何一個時間點、一個時間段內發生事情的結果,都會有數字來展示。例如UV50000人、轉化率5%、介面報錯42次。

當你看到數字類的指標時,第一反應應該是這個事情無論如何,都已經發生了,結果是否滿足預期,高了還是低了?至於其他的拆解,和數字本身已經沒有任何關係了。

專案中的高層領導,一般只會看資料面板,因為那裡等於告訴你,這件事的結果是怎樣的。其餘的決策和思考,他自有分寸。

看陣列,看的是一個趨勢,單獨在表格裡看陣列,你對數字的波動的敏感度是不高的,甚至可以說是模糊不清的。陣列是由數字組成,雖然也是滯後性的指標型別,但是透過橫縱座標的陣列羅列,你能推斷出這件事大致的趨勢。

如何從0開始學習商業資料分析,有哪些基礎的東西需要了解?

例如這是昨天A股的折線圖,這就是最經典的陣列,只不過在單個數值點上還賦予了他其他更豐富的意義:

如何從0開始學習商業資料分析,有哪些基礎的東西需要了解?

02

維度拆分

當你看完數字得出結果並不理想,看完陣列發現已有明顯下跌趨勢,這個時候你就需要找出資料下跌的原因。

怎麼找?拆分維度。

維度可以理解為是每個資料乃至每個指標的影響因素,按應用版本來劃分,按作業系統來劃分,按訪問來源來劃分、按訪問地區來劃分、按瀏覽器來劃分、按使用者年齡來劃分等。

如何從0開始學習商業資料分析,有哪些基礎的東西需要了解?

這些都是有可能影響資料異常的因素,在進行維度拆分之前,我們先要先把可能性低或者不存在的維度排除在外,然後再把剩下的維度逐一梳理。尤其需要注意極端情況下的維度拆分,最高點和最低點。

這個方法雖然笨,但勝在管用。

03

使用者分群

資料之所以會波動,是因為有人的存在,資料之所以有挖掘的必要,是因為人以群分。

經過上一步的維度拆分,我們大概能知道有些什麼原因令到資料產生波動,對於每種資料結果相反的兩類使用者群,都有必要為他們單獨建立一套畫像,抽離出來。

例如在一次投資流程的資料分析中,至少這麼幾類:

瀏覽了投資詳情頁的使用者/沒有瀏覽投資詳情頁的使用者;

瀏覽完有投資意願的使用者/瀏覽完沒有投資意願的使用者;

首次投資了大額資金的使用者/首次投資了小額資金的使用者;

二次還有投資的使用者/二次沒有投資的使用者;

……

有了這部分群體,可以再著重看使用者的行為資料:頁面停留時間、投資總時長等,這裡的行為資料主要以時間的維度為主,目的是觀察使用者的決策鏈長短受什麼影響。

最後,加上使用者的個人資訊資料綜合檢視,例如性別、地區、是否新手、賬戶餘額、有沒有優惠券等,整個使用者的形象分類就會躍然紙上。

而你這個時候只需要投其所好即可。

04

轉化漏斗

絕大部分的產品都是商業化的,即使沒有商業化的產品,也存在核心價值能否體現的問題,如何衡量當中這個流程?

用漏斗來分析轉化。

如何從0開始學習商業資料分析,有哪些基礎的東西需要了解?

漏斗將會把使用者使用的路徑,用關鍵步驟串聯起來,然後設定一個使用的時間區間,最後觀察整個資料轉化。

漏斗轉化其實沒有什麼好說的,要注意兩個方面即可:

轉化步驟越小越好,越能說明本質問題;

轉化率最低的並不一定是最需要關注的,第1、2步的轉化最佳化遠比後面的重要;

05

使用者行為路徑

上面的四個指標,都屬於是一些結果型指標,但是在做資料分析的時候,結果型指標有時候是會說謊的,就像平均數一樣,並不能反映出平均水平。

有時候我們還需要藉助其他手段,來還原使用者的使用路徑,這些稱之為過程指標。

現在市面上例如神策、GrowingIO之類的,都能視覺化顯示出使用者的特定路徑,這個對大部分決策者來說,查詢不是件難事,難的是推敲出背後的使用者意願。

如何從0開始學習商業資料分析,有哪些基礎的東西需要了解?

由於篇幅有限,就不在這裡展開了。

06

留存分析

說留存之前,我感覺有必要說一個被無數產品過的事實:無論在人口紅利期還是使用者增長瓶頸期,留住一個老使用者的成本,遠遠要低於獲得一個新使用者。

現在流量和渠道已不像以前那樣便宜了,新使用者的獲客成本往往高得嚇人,而且新使用者還伴隨著學習、轉化等不可逾越的流程,而老使用者則輕鬆很多。

而留存也分很多種,3日、7日、15日和30日的都有,目的是透過時間段不斷地拉長,我們能透過使用者行為的軌跡,發現出與使用者有關聯的方式和因素。

例如最著名的例子,LinkedIn在早期,透過大量的資料研究發現,如果新使用者進來後,有新增好友的行為,並且超過5個,他們的留存會遠遠比那些完全沒有新增過好友的使用者高。

為此,LinkedIn開展了一系列新增聯絡人的引導和最佳化,最終這也成為了LinkedIn留存新使用者最核心的手段。

這就是使用者的關鍵留存行為,也是我們務必要找到的。

07

A/B測試

所謂的AB測試,意思就是在相同變數的情況下,去對比兩個方案,哪個好一點?其中相同的變數也包括是時間、使用者群體等。

如何從0開始學習商業資料分析,有哪些基礎的東西需要了解?

AB測試是檢驗產品迭代可行性最優的方式了,沒有之一,並且AB測試也是做增長專案的一把利器,這裡對於AB,我有幾點建議可以提及一下:

1、當你的產品要做AB測試時,務必把測試時間拉得儘可能長,最好能完整覆蓋使用者的一段使用週期,避免因為時間不夠,只是對比了部分樣本的波動就做出了草率的結論。

要知道準備一次AB測試,是要耗費比較多的人力物力的,所以儘可能要拿到正確的結果。

2、如果你所測試的產品流程或者功能,資料密度不高、資料量不大的情況下,就沒必要用AB測試了,因為就算你做完測試,結果還是很模糊的,還不如找個憑藉經驗去決策來得高效。

以上,就是關於資料分析一些最基礎的認識,這七個概念的組合,足以輔助市面上大多數產品型別的決策了。