大數據時代來臨!做資料分析須注意的6大問題

文: 先行智庫 授權轉載

原文標題:如何避免資料分析地雷?本篇解析從工具到人都會遇到的6大問題

本文摘自《沒有數字腦也能輕鬆解析數據》未經同意請勿轉載、摘編

大多數人都認定「資料科學家」具備高超的程式設計能力,但近年來資料分析的需求提高,不需要優秀的程式設計能力也能進行資料分析的工具逐年增加。所以未來若要進行資料分析,一開始只要選擇最普通的方案,就可以用最低限度的金額達到分析的目的。

重點閱讀:

在數據分析的流程中,當我們已經構想出符合目的的輸出形式、獲得了公司內外的協助,也取得了資料。材料已經備妥,資料分析即將在「Develop」步驟進行。

若以料理比喻,Develop(開發)這一步驟相當於動手調理食材,同時也是最令人開心的步驟,我想大部分的讀者都是抱持著「準備好好大顯身手」的氣勢迎接這個瞬間。若要順利執行Develop 步驟,如何運用工具,選擇環境,達到適才適用這點非常重要,不用刻意準備高難度又昂貴的工具。

以料理來說,如果為了切魚而買了Develop(開發)高級刀具,但卻不知道切魚的方法,或是買了附有蒸氣烘烤功能的高功能微波爐,但卻只使用微波功能,最後也只是浪費錢而已。

進行資料分析也是如此,分析必須具備技術和知識,而如何在技術、知識和工具的使用間取得平衡也非常重要。在料理這門學問中,如果要乾脆俐落的殺魚切魚片,只要拿到合適的專用工具,就算是新手也能輕鬆辦到。若要開始進行資料分析,建議可以先從整備適合用於進行Design步驟所決定的輸出形式的工具和環境開始。

如何避免資料分析地雷?本篇解析從工具到人都會遇到的6大問題

資料分析從「工具」到「人」可能都會碰到問題

從最普通的方案、最微小的機能開始

一般來說,大多數人都認定「資料科學家」具備高超的程式設計能力,但近年來資料分析的需求提高,不需要優秀的程式設計能力也能進行資料分析的工具逐年增加。市售的收費工具多半是根據使用人數而調整金額的訂閱制模式,所以未來若要進行資料分析,一開始只要選擇最普通的方案,就可以用最低限度的金額達到分析的目的。

尋找工具時,希望讀者們可以留意「透過AI自動分析」的工具。雖然我沒有否定這類工具的意思,這項類別裡,優秀的工具也非常多,但在接下來開始進行資料分析的階段,大部分情況並不需要這項功能。對於剛開始使用者,或是不那麼熟練的人來說,如果能了解如何對資料進行加工、運用什麼方法分析統計資料,會是比較好的做法。

只看書不動手

資料分析時常犯的錯誤模式是只在腦中空想。說起來,這是因為大數據AI熱潮,相關書籍如雨後春筍般推出,書中也解說各式各樣不同的分析手法。

閱讀這些書籍確實能增加知識,但理論和實際運用是完全不同的。針對重點內容除了要理解理論外,同時也需要實際操作。相信透過我們在前面提到的做法,學習會更有效率,也比較不會感到挫折。

「結論」怎麼來?

先前已經提及:最近有些分析工具附有「自動數值預測功能」,這項功能只要決定需要輸入的數值和想要預測的數值,就會自動製作出最適合的模組,預測的精準度也不在話下。而這種功能的缺點是:容易導致我們無法找出導出該結果的關聯性。簡而言之就是淪為黑箱作業。

舉例來說,商品的營業額牽涉到各式各樣不同的要因。例如價格、商品包裝、品質是屬於商品本身的因素;什麼區域可能已經進貨該商品,商品陳列於店面內的什麼位置屬於賣場的因素;花多少錢宣傳打廣告、廣告是什麼樣的內容,則是廣告因素。

除此之外,還有景氣、流行趨勢和稅金等環境因素。這些因素都會在實際層面上影響到商品的營業額。再加上這些因素相互影響,關係複雜。在這種情況下,若使用「自動數值預測功能」預測未來的業績,雖然仍能得出精確度極高的預測結果,但因為各項因素都被組合得複雜難解,最後反而搞不清楚什麼因素有利於提高營業額。

預測未來的業績並非不重要,但大多數人更想要知道的是:若是要提高營業額會碰到什麼課題、應該掌握哪個部分、需要如何改善,同時也希望負責的部門能正確應對。

若以這樣的脈絡思考便會發現,容易淪為黑盒子的自動數值預測功能並不是適合的工具。當業績下滑時,如果無法明確知道是廣告的因素,或是商店的問題,那麼是廣告負責人或是商店負責人都將束手無策。

自動數值預測功能適合用於不需要知道因素,只需要知道預測結果的情況。舉例來說,藉由身體的動作判斷是否為危險人物,或是鎖定可能會退會的會員。若是這類即使不知道原因也無所謂的情況,就非常適合使用自動數值預測功能。

雖然這稱之為「自動數值預測功能」,但近幾年來和大眾口中的「AI」幾乎是相同的意思。查詢資料分析的相關資料時,我想應該會連結到「AI解決方案」或「AI工具」等相關服務。

但在進行資料分析時,不能因為看起來很方便就盲目使用,必須退回Demand和Design步驟,判斷這些服務是否適用。我想表達的並非絕對不可以使用AI服務。而是建議在新手階段,可以先建立加總合計這一類比較基礎的分析手法後,再運用預測機能。

延伸閱讀:老闆問你員工離職原因?這樣用Power BI,數據分析一目了然

如何避免資料分析地雷?本篇解析從工具到人都會遇到的6大問題

只提出無法進行的「策略」

經由資料分析導出下一步應採取的行動時,如果是自己負責的業務內容,因為了解現場的狀況,所以提出不合理要求的機率相對較低。但當分析的內容不是自己負責的業務範圍,而是由其他部門負責時,因為不了解負責部門的現場實際狀況,便容易提出過於理想化的提案。

舉例來說,在使用過去的資料預測市場行銷策略改變後的業績時,因為坐在電腦前無論改變條件幾次,都能模擬預測;所以在實際與同仁會議時,便會不假思索的提出「將所有市場行銷策略試過一輪,找出哪一個方法最有利於提高業績」的提案。

雖然這是非常極端的範例,但令人意外的是,提案「花費大把經費執行行銷策略」的人相當的多。這種時候只會在負責人破口大罵「這種事我也知道!就是因為做不到才煩惱啊!」的情況下收場。在這樣的情況下,建議不要只是將業績和花費的經費這類互相矛盾(Trade off, 抵換關係)的因素納入,同時也必須納入次要的方案,如此一來討論才能繼續下去。

光知道%數沒有用

報告資料分析時很常發生的另一個狀況是:只突顯或延伸某個數值。例如:向上層報告「就算實施某個策略,成效也只有上升○%」時,完全無視引導出該預測結果的前提條件和準確度,只向其他部門傳達了數值這樣的結論,可能會造成策略負責人與資料分析人員之間的衝突。事實上,若分析結果有一定程度的精確度,以這個數值向公司進言是為了公司著想,這件事本身並沒有問題,但需要思考的是傳達方法。

單純呈現實際情況的數值無傷大雅,但預測值說到底也只是存在發生的可能性,因此報告時必須小心注意。此時,不應該著眼於預測值的數值,例如可以界定A和B兩種策略,並把報告方向設定成藉由討論兩者的優缺點,進一步建議該採取哪一種策略。

委外不順

最近出現了資料分析業務外包的公司。當被上層下達「給我想辦法活用資料」的嚴格命令時,自然會想委託聚集眾多資料分析專家的公司協助,但失敗的案例不在少數。

許多企業即便委託專業機構進行分析,最後發現只是耗費彼此的時間和金錢的狀況也不在少數—不是什麼成果都沒有,就是報告書做好了,卻被束之高閣,可說是令人遺憾的結果。

當然,委託資料分析公司進行分析並不一定都會以失敗收場。但若不清楚資料該解決什麼課題,那麼問題就是出在委託方。但就委託方而言,若負責分析資料的人員很少,甚至只有一個人,那麼需要商量對象也是無可厚非。

但即使如此,也不需要馬上委託其他企業協助,希望各位能先實際嘗試進行一次本書建議的5D框架。透過這個方法,可以了解自己能做到什麼程度,同時也能明確知道哪個部分還需要加強。如此一來,就能清楚知道該將什麼部分委託給其他公司執行,也能藉此選出最合適的委託對象。 委託外部企業時,也不能將問題全部丟給對方處理。應該先確認清楚自己無法做到的環節,再將這部分委託出去。舉例來說,若是無法將文章資料做成能夠分析的形式,就只需要向分析公司委託這項作業即可。如此一來,就能減少多餘的費用支出。

掌握數據Know-how,提升招募效率 >>

用數據做好人資管理,歡迎報名 >>