想當「資料科學家」該如何準備面試?不要期待你什麼都懂、掌握新知更重要!

「資料科學家」是現代職場很看重的職缺,近年來頗各產業所重視,若想加入「資料科學家」的行列,在面試準備、職涯發展上該做哪些功課?前輩除了分享經驗外,最關鍵的是:「不要期待自己什麼都懂,面試官通常更重視的是能在變動環境中快速學習、掌握新知」,因為這是個追求不斷改變、往前邁進推廣的新興職務,願意學習的心態很重要。

文/Kao Jia

這篇文章是寫在我剛從研究所畢業的階段,當時我非常迷惘,不知道可以找什麼樣的工作,當時正好透過學校資源聯絡上在科技業擔任「資料科學家」的學姊(現在回頭看就是所謂的coffee chat吧哈哈)。

透過這次的機會,讓我對於資料科學家的職涯發展有初步的認識,也成功化解了我許多迷茫。不過現在的我發現當時的文筆實在太差😅,於是趁著這篇文章還沒有太多閱覽量時快快回來重寫,希望這次的分享能夠對資料科學有興趣的讀者有幫助!

選擇與專業非直接相關的路時的注意點

先來個背景介紹,學姊和我過去都是生物統計專業的學生,基本上在這個專業的學生畢業後都會進入臨床試驗受託機構(Contract Research Organization)選擇與新藥開發、統計分析相關的職缺工作。然而學姊在畢業後選擇進入與製藥無關的企業轉型工作,爾後輾轉進入科技業成為資料科學家。

在學校學習的領域知識在學姊的第一份工作中幾乎用不太到,因此在前期學姊花了許多時間去了解企業轉型需要的知識與資訊。在這裡她提到一個重點,在選擇一份跨領域的工作時,公司提供的員工訓練與資源會顯得非常重要,特別是對於剛出社會的新鮮人,除了要適應從學生到社會人的轉換,也需要學習跨領域的知識。因此公司若能提供培養新鮮人的所需的資源就會是跨領域求職非常大的吸引力,當然以求職者的角度來看,出社會後的持續學習也是非常重要的。

資料科學家多的團隊好,還是一支獨秀好

有些企業對於資料處理相對成熟,在一個團隊中有多位資料科學家;而有些企業相對數位轉型較慢,團隊中只有一位資料科學家或資料分析師,這兩種團隊各自有優缺點。

資料科學家多的團隊對於剛進入產業的菜鳥來說,成長曲線可以是穩定上漲。當面對到困境時,因為大家背景相同,可以透過與團隊討論來加速解決問題;然而當你需要吸收領域知識時,則需要跨出團隊找其他部門專業背景的人來補足。相反的,在資料科學家較少的地方則成長曲線很陡,對於新人來說需要花許多努力去學習,相對的也有許多發揮空間,端看個人想要進入哪種環境。

資料科學家的面試經驗與準備方法

我自己過去有一些面試與資料分析相關的實習經歷,以實習而言大部分的面試會包含兩關,首先會進行 SQL或Excel的考試,大部分會是以 take home的形式 ,第二關則是直接與用人主管面談。

針對正職的部分,學姊分享到在面試時基本上差異不大,但會經歷三到五關不等,其中包含:HR電話面試、考程式能力、peer interview / 主管面談、經理/總經理面談。

程式能力可以嘗試以Python為主去準備

我和學姊在大學期間是學習R語言為主,在準備程式能力這部分的時候會比較辛苦,因為許多企業還是以 C, C++, Python居多。考量到易上手程度,可以在面試前針對 Python 進行刷題(請搜尋 LeetCode or HackerRank)。

有些考試形式會是需要現場用紙將code寫下來,俗稱白板題。這種情況因為沒辦法跑程式,難度會較高,另一種是上機考,如 codibility 線上測驗,面試官可能會開鏡頭與你互動,也可能會直接錄螢幕的考。

有些題目的難度可能會偏高,不過學姊分享有時只要考試結果分數大於 0,就有機會進入下一關,因此在考試時寫錯跑不過也不用太驚慌。

面談主要看對於資料科學的知識與邏輯能力

面談的部分基本上是由主管或是團隊成員進行,他們問的問題通常是與資料分析技術相關,而越上層的主管則容易問 behavioral question或是情境題,這種題目沒有標準答案,但注意回答要有邏輯。

技術類型的面試問題,如:請你說明機器學習中的一些演算法邏輯、這個演算法的優缺點如何、在什麼情況下使用較好⋯⋯等,是可以透過對知識的重新複習來提前準備。

另一個可以提前準備的部分是練習報告曾經做過的project。有些面試是會請面試者拿出手邊有的碩士論文簡報現場報告,這裡就能看出面試者對於碩士論文資料處理的邏輯、能否把複雜的內容清楚表達,因此練習報告時可以先將每一頁的講解方式梳理清楚,有可能被問的問題提前列好(像是學位口試一樣🙆‍♂️)。

能寫在履歷上的,表示你對這件事有足夠的自信

學姊也提到她在擔任面試官面試其他資料科學家時,會十分注重面試者在履歷上寫的內容。她認為能寫在履歷上的,表示你對這件事有足夠的自信,因此她也會針對這些問題進行深挖,如果沒有準備好,就容易在面試中出現破綻,因此在面試前可以使用 STAR 原則針對履歷上的每一點經歷進行整理,並思考以下問題:

  • 能解決這個問題有很多種方法,為什麼選擇這個方法來解決?
  • 你覺得如果重新來一次,有哪些可以改善的地方?
  • 你覺得使用這個方法的好處與限制是什麼?你怎麼克服這個方法的缺點?

📕補充:在履歷上也可以將自己的資料分析作品集以連結的形式放上去

面試時不用期待你一定要什麼都懂

這是我覺得這次和學姐聊天時醍醐灌頂的一句話,在準備面試時,我很常擔心回答不出技術性問題。我們可以換個角度想,市場上越來越多新興職缺如ESG專員、人工智慧專員等,實際上這些領域知識也是近十年來逐漸興起而被推廣的,很少有人在這些職缺出現前就是專家,如去年興起的生成式 AI就是其中一例。

在面試時,比起像ChatGPT一樣每一個專業問題都能回答,面試官更想知道你是不是能夠在變動的環境快速學習、掌握新知。因此面試過程中不要怕被問倒,充分展現自己的認知以及願意學習的心才是最重要的。

生物統計背景在擔任數據科學家的優勢

這題是我自己私心想問的XD。如前述所言,資料科學家是這幾年新興的職缺,目前任職的資料科學家也必定來自各式各樣的背景,那麽生物統計背景的求職者們有什麼樣優勢呢?

學姊分享到,在團隊中可能有些人是電資背景,那麽他們寫程式的能力就會很強,這部分的確是比較難超越。不過她覺得生物統計的教育背景能夠提供給我們很好的實驗設計、統計分析、以及報告的解讀能力,如臨床試驗中的Randomized Control Trial,就和商業場景中的A/B Test有異曲同工之妙,我們了解這些實驗設計可以避免什麼樣的問題,也能夠清楚解釋統計分析的邏輯和過程,並能針對模型結果有正確的解讀方式,這會是我們在團隊中能夠發揮的地方。

(原文標題:【職涯航道】資料科學家之路:職涯初期發展與面試如何準備


想投身【資料分析】的行列,可以怎麼做?