人工智能背後的「工人智慧」 《時代雜誌》揭ChatGPT成最強AI全靠一群血汗工

今周刊
2023.02.21
13963次觀看

「最強AI」ChatGPT推出兩個月就成為史上用戶數增長最快的消費者應用程式,不僅有人拿來寫論文、檢查程式代碼,甚至國外有法官拿來協助審判。《時代雜誌》揭露看似人工智慧革命背後的黑暗面:ChatGPT能如此人性化全賴一群時薪不到2美元的肯亞勞工來「訓練」機器人,他們卻因長時間接觸色情與殘酷內容的字句文本而留下心理創傷......

整理/黃明惠 由今周刊授權轉載

被譽為「最強AI」的ChatGPT近來在網路討論度極高,不僅有人拿來寫論文、檢查程式代碼,甚至國外還有法官拿來協助審判;而ChatGPT全球活躍用戶數更快速攀升至1億人次,輝達(NVIDIA)共同創辦人暨執行長黃仁勳也將其視為「AI的iPhone時刻」已經到來。

然而,看似掀起人工智慧革命的背後,ChatGPT卻有鮮為人知的黑暗面。外媒報導,ChatGPT的開發者OpenAI,僱用了時薪不到2美元(約新台幣60元)的肯亞外包勞工(數據標註員)來「訓練」 ChatGPT,這些勞工因長時間接觸色情與殘酷內容的字句文本,留下心理創傷。

也許你沒想過,ChatGPT 成功背後,竟是依賴全球最廉價的勞動力,而這些數據標註員被大幅剝削且留下精神創傷,卻鮮為人知。

ChatGPT究竟是什麼?它有哪些用途?帶您一次了解。

ChatGPT是什麼?由誰開發?

ChatGPT是一款AI聊天機器人,透過自然語言處理(Natural Language Processing)模型分析大數據。當使用者以文字輸入提問或敘述,ChatGPT會分析文本的意涵,再輸出結果給使用者。

除了基本對談和搜尋資料,ChatGPT也具備問答解惑、產生程式碼和除錯,甚至有撰寫論文、小說劇本等能力。

ChatGPT的開發者是人工智慧研究實驗室OpenAI,該組織在2015年由特斯拉創辦人馬斯克(Elon Musk)以及全球知名創業加速器Y Combinator前總裁阿特曼(Sam Altman)等共同創立。2018年,馬斯克在考量特斯拉的自駕技術發展與Open AI可能衍生的利益衝突下,宣布退出OpenAI的董事會。

ChatGPT為何被稱為最強AI?

《時代雜誌》報導,由於AI聊天機器人的構建必須有巨量的數據,以OpenAI在2018年推出的第一代GPT為例,就有1.17億參數,2020年5月發布的GPT-3更高達1750億參數。

雖然目前ChatGPT(GPT-3的升級版)尚未公布參數量,但對比Google過去推出的語言模型BERT的3.4億參數量,專家分析ChatGPT的參數量明顯遠高於此,也因此ChatGPT被網友稱為最強AI。

而現階段ChatGPT開放所有使用者免費使用,不少文字工作者、工程師、學生,會運用ChatGPT自動生成文字、摘要、表格、翻譯或者除錯程式碼,廣泛的用途與強大的功能,讓僅推出兩個月的ChatGPT成為史上用戶數增長最快的消費者應用程式。

ChatGPT有哪些功能?

ChatGPT也可以當作搜尋引擎,詢問天氣、專有名詞或是歷史事件。ChatGPT還能協助書寫特定用途文文本,像是:

回覆郵件:輸入一段信件內容,讓ChatGPT針對內容,產出一段回應信件。

故事創作:輸入角色、時間背景或劇情等設定,讓ChatGPT完成短篇故事。

寫程式:ChatGPT可依使用者需求,寫出特定功能程式碼,或是檢查程式碼是否有錯。

翻譯:輸入中文或英文內容,可以要求ChatGPT為你翻譯成其他語言。

修改文法錯誤:輸入一段文字後,能請ChatGPT判斷是否有文法錯物、如何修正。

寫詩、歌詞:輸入關鍵字,ChatGPT就能寫出符合主題、字數的詩詞或歌詞創作。

整理資料重點:能分析長篇幅的文本,進行條列、分類,製作成表格。

ChatGPT有哪些爭議?

每日郵報報導,一名哥倫比亞法官巴迪亞(Juan Manuel Padilla)在審理貧困家庭的案件時,將案件的關鍵字輸入給ChatGPT,並在判案過程中採納ChatGPT給出的意見,免除該貧困家庭的預約看診、交通及治療的費用。縱使巴迪亞強調,自己沒有因此失去判斷力,但運用AI審理判決的做法,已掀起反彈聲浪。

除此之外,國外也有學生使用ChatGPT寫作業、論文,因此為避免學術造假,多國學校禁止學生在校內使用類似ChatGPT的人工智能工具,中國多所大學也公告,如果學生被發現使用ChatGPT寫論文,將被退稿或撤稿。

時薪不到2美元 數據標註員每小時閱讀、標註2萬個單詞

然而,AI科技背後,OpenAI 卻被報導僱用時薪不到2美元的肯亞外包勞工訓練 ChatGPT,負責的工作就是對龐大的數據庫手動進行數據標註,因此被稱為「數據標註員」。

《時代雜誌》報導,OpenAI在2021年底與Sama簽署了三份總價值約20萬美元的合約,為數據庫中有害的內容進行標記。Sama是一家總部位於美國舊金山的公司,該公司僱傭了肯亞、烏干達和印度的外包員工。

大約30多名工作人員被分成三個小組,每個小組都專注於一個主題。三名員工表示,他們每9個小時要閱讀和標註150~200段文字。這些段落的範圍從100個單詞到1000多個單詞不等。如此計算,平均每小時他們最多要閱讀和標註超2萬個單詞。

《時代雜誌》發現這些數據標註員,工時為9小時,實際時薪約為1.32美元至2美元(約新台幣 39.9 元 ~ 60.5 元),詳細的薪資還要看資歷跟表現,而他們平均每小時最多要標註超過2萬個單字;更有員工指出,這樣的工作在他們心裡留下創傷、甚至出現幻覺。

清除暴力、性別歧視等言論 全靠人工標記

ChatGPT 的前身 GPT-3 語言模組藉由網路上數千億個單詞進行訓練,但 GPT-3 不具備清除惡意資訊的能力,而被用戶詬病會得到與暴力、性別歧視和種族主義相關的回覆,因此技術團隊標記惡意言論的標籤和模型相當重要。

《時代雜誌》報導,為了獲得這些語法標籤,OpenAI 從 2021年 11月委託肯亞的一家外包公司 Sama ,並發送數萬個文本片段讓其員工進行標記,其中大部分文本似乎從暗網中提取,內容包括兒童性虐待、獸交、謀殺、酷刑、自殘和亂倫等可怕內容。

標記員留下精神創傷

《時代雜誌》 也採訪了參與 ChatGPT 項目的四名 Sama 員工,他們都表示這項工作讓他們在精神上留下了創傷;其中一位負責為 OpenAI 閱讀和標記文本的工作人員表示,他在閱讀了一名男子在幼兒在場的情況下與狗發生性關係的文本後,反覆出現幻覺。

不過Sama 的發言人對此說法不贊同,「這些說法是不正確的。員工有權與受過專業培訓並獲得許可的心理治療師進行個人和小組會談,這些治療師隨時都能讓員工聯繫。」

(原文標題:AI一點都不AI?《時代》揭ChatGPT背後「血汗真相」...這群人時薪僅60元、判讀字詞出現幻覺


推薦閱讀:

加入粉專,每天收看職場力最新文章

《今周刊》由最專業的新聞團隊為讀者揭露揭露第一手的財經資訊與產業動態。從國際趨勢、政治經濟情勢、產業動態到理財規劃及社會文化資訊。