給剛入行的數據分析師-想產生價值,在試用期要做的三件事

11月了,相信不少剛出社會的新鮮人也都找到了心儀的公司加入了職場。(因為我這也陸續出現了幾位新人…)

加入新公司,都想要快點產生價值,想著研究所學了這麼多技能,會用R/python,算法也難不倒我,時間序列、回歸分析、聚類分析等數學理論與代碼隨手捻來。指望著一進公司就做出超屌的事情…

然而作為數據分析師,相對其他職位往往是更難直接體現經濟效益的。

相對設計、前端、後端,一個產品的頁面設計好不好看,頁面展示有沒有正常,功有沒有bug,這都很容易衡量。一線的客服耐心的解決客人問題,銷售、管道管理、門店培訓培訓一類馬上關乎到公司獲得的鈔票。

那,數據分析呢?

所以…先別想這麼多了,數據分析師的試用期,先花點時間好好把基礎掌握牢固,我認為可以從以下三點出發:

  • 查看部門以往文檔跟分析報
  • 瞭解產業的運營模式與流程
  • 熟悉常用的數據表與任務流

這三點要花多少時間呢?我也回答不出來,要看產業複雜度、你對產業的熟悉度、公司業務複雜度來決定。如果在一個比較複雜的業務環境,光是熟悉比較常用的表以及摸透表之間的關係,就可以玩三個月了(剛好是試用期結束),更何況很多公司的數據庫又髒又亂永遠是個謎…

P.S. 文章針對數據分析師。如果工作內容是明確的ML或是資料倉庫工程師不適用

1. 查看文檔,尤其是以往的項目或報告

查看過往的文檔,了解部門之前做過哪些事。如果是項目,可以了解項目背景,數據量在什麼範圍,用了什麼方法,問題被解決到了多少的程度,部門內部彼此分工或是與部門外的協作方式。

如果有月報或任何分析報告,就好好閱讀,了解前輩的分析思路、分析框架。了解基本觀察指標有哪些,指標數字大概落在什麼水準?歷史趨勢的波動哪裡高?哪裡低?(代碼要來看更好)

除了對對公司整體環境有基本的了解,可以作為日後分析的交叉對比,判斷自己的數字是否合理、解析這個數據代表着什麼。

2. 瞭解產業的營運模式、內部流程之間的流轉、包含規則與名詞定義

數據的價值,簡單的說,就是透過客觀的數據解決業務方的痛點,痛點可以是運營策略建議、也可以是單純要有數據來衡量效果,因此我常常強調,分析師要比業務更了解業務。

如果數據不結合具體的行業、業務知識,數據就是一堆數字,不代表任何東西。是冷冰冰,是不會產生任何價值;數據驅動營銷、提高科學決策一切都是空的。

了解產業營運流程,可以幫助我們形成「面對問題的分析思路」,從更上游的環節來思考與找尋原因。運營規則,也會影響到取數數條件,或是分析結果的解讀。

舉例來說,註冊規則由「一個手機號只能註冊一次」開放成「一個手機號可註冊多用戶」,那註冊用戶數變高就不是什麼稀奇的事了。

雖然行業、業務知識的是一點一滴的積累起來的,有時候是急不來的,但還是有入手的方向:

  • 問老闆,尤其內部規則類的,應該多少都會有整理文檔
  • 向業務部門多請教,多溝通。數據分析師與業務部門沒有利益衝突,而更向是共生體,所以如果你態度好,相信業務部門的同事也很願意把他們知道的告訴你。
  • Google或瀏覽行業相關的網站,看看行業都發生了什麼?主要競爭對手或者相關行業都發展什麼大事,把這些事與公司的業務、數據結合起來。

3. 熟悉數據表與任務流

只有把數據先取對了,才能正確的分析,否則一切都是錯誤了,甚至會導致致命的結論。連表結構跟數據字典都沒熟悉,是要分析什麼呢?

基本要求是看到某個指標,你很清楚的知道,這個數據的統計口徑是什麼?是從哪張表取出來的?

例如「新會員」是什麼。第一次在使用某產品的會員?還是在站在公司角度上說,第一次在公司發展業務接觸的會員? 時間是通過創建時間,還是業務完成時間?完成時間是下了單就算,還是要成功支付?

一個任務流包含了資料獲取-清洗-存儲-開發-維護,每個環節上都是誰在負責?情况如何?畢竟髒數據越少,你花在數據校驗的心力就越輕鬆。

最後,分析工作的第一步都是提取數據,公司的數據都放在資料庫中,如果一名數據分析師不會寫SQL,那麻煩就大了。

去Hahow學習:【入門數據分析掌握Hive SQL取數能力】

歡迎分享你的心得

🙌 你是數據分析新手嗎?入行必學SQL課程由此開始 >>>

X
Scroll to Top