學習成長

2023.01.16 | 6469次觀看

ChatGPT 紅什麼?強大AI會聊天、寫作、抓蟲(debug),講中文也通!

你聽過ChatGPT機器人嗎?ChatGPT是什麼?它是這幾個月網路討論極高的AI聊天機器人,它可以根據你的問題給予適當解答、說笑話、寫code、編故事、甚至請它幫程式debug除錯都沒有問題,可能比你同事還可靠。重點是,ChatGPT支援中文,而且語意還算流暢,本文有一段就是ChatGPT撰寫,你能猜出來嗎?

文/《104職場力》小編 整理

ChatGPT是什麼?

ChatGPT是透過機器學習(machine learning)中「自然語言處理技術」(Natural Language Processing, NLP)來實現相關功能。

利用人工智慧(Artificial Intelligence, AI)、數據分析(Data Analysis)和語言模型(Language Models)等技術,能夠理解用戶所送出的訊息,將輸入文字轉換成對應詞彙並組成語句,進一步進行回應。

ChatGPT是誰開發的?

ChatGPT由一家非營利性人工智慧公司「OpenAI」開發建置,其成立宗旨在於解決人類在科技上遇到的困境與問題,為未來AI研究創造基礎。而為了改善人類和機器間的互動,該公司由世界各地頂尖研究人員與學者組成,透過機器學習與學術研究開發人工智慧技術,為全球社會創造價值,也幫助人類對自然環境更加充分的理解。

而目前OpenAI主要開發的技術包含了:

  1. 機器學習(machine learning):透過機器學習以自動化方式學習和應用新知識,用以改善人工智慧的表現。
  2. 深度學習(deep learning):透過深度學習開發更深入和多樣化的應用,更有效理解並模擬人工智慧的行為。
  3. 自然語言處理(natural language processing):使用自然語言處理,更加深入理解和模擬人類的言語行為。
  4. 自主式行為(autonomous behavior):研究開發智慧性自主式行為,理解、模擬並建立人類之行為模式。

ChatGPT可以為我們做什麼?是免費的嗎?

ChatGPT具有自動建立關聯、細節識別、情緒識別等功能,可以輔助AI聊天機器人更加人性化的回應用戶話語,也更加精準的識別用戶提出的指令,為用戶解決問題:

  1. 自動建立關聯:識別用戶話語中的關聯並提取出相應詞語
  2. 細節識別:識別用戶話語中的細節,如時間、地點、人物
  3. 情緒識別:識別用戶話語中的情緒,如歡樂、憤怒、恐懼
  4. 指令識別:識別用戶對聊天機器人的指令,如搜尋檔案、提供信息等
  5. 自然語言處理:將用戶話語轉譯成機器可以接受的語言,以完成聊天機器人的任務。

而當前提供免費註冊使用,火熱引發話題下,當前已超過100萬名的使用者。然而服務運行所費不貲,免費服務有機會持續下去嗎?

ChatGPT運作原理是什麼?

那麼一定很好奇ChatGPT是如何辨識用戶提出的問題並字句流暢的回答?

ChatGPT 運作原理
圖片來源:ChatGPT Blog

ChatGPT所使用訓練邏輯模型和InstructGPT類似,前者透過GPT-3.5微調而成、後者則使用GPT-3,另外使用微軟Azure AI的超級運算進行訓練,經過大量資訊、文本與文意收集數據並分析。

而ChatGPT的學習方式,專精於語意理解、辨識及機器與深度學習的台大電機系副教授李宏毅從相似的InstructGPT說明,其可能具有4個學習階段:

  1. 學習文字接龍
  2. 人類老師引導文字接龍的方向
  3. 模仿人類老師的喜好
  4. 用增強式學習向模擬老師學習

1. 學習文字接龍

透過當前收集到的資訊,推測接下來可能出現什麼字,並以此接續下去。

譬如「你好」這一個尚未完整的句子,透過網路上學習到的各種數據,後面就有可能接上「嗎」形成「你好嗎」;也可能接上「高」形成「你好高」;當然也可能是「美」形成稱讚對方「你好美」,而有許多種可能。

因此當輸入一個不完整的句子時,就可能產生許多種回答,有機率的每一次輸出都不同。不過單純利用文字接龍其實就可以回答問題,譬如:

詢問「台灣最高的山是哪一座?」,GPT便透過網路上蒐集的資料判斷接下來可能接上「玉」,再接上「山」,而形成「玉山」這個答案。

然而,實際上每次輸出都可能不同。從收集分析的資料也可能產生「玉山」以外的答案,如它爬到的資料是一道題目克能就出現了「(A)雪山 (B)玉山……」,或者輸出「誰來告訴我呀」等問句形式。

那如何引導GPT產生有用的輸出?

2. 人類老師引導文字接龍的方向

輸出結果可能不是使用者想要的答案,而為了精確就需要透過人工來思考問題、篩選正確的答案。

譬如「台灣最高的山是哪一座?」人們需要的答案是「玉山」,那麼透過篩選正確答案也就讓GPT不需要窮盡所有問題,蒐集資訊偏向人類的喜好。

3. 模仿人類老師的喜好

接著就需透過Teacher Model將每次我們從GPT得到的回答判斷,譬如「台灣最高的山是哪一座?「玉山」及「台灣最高的山是哪一座?誰來告訴我呀」,Teacher Model目標去模仿人類老師喜好的標準。

如果是人類想要得到的答案,那該回答就會給予較高的分數。

4. 用增強式學習向模擬老師學習

最後用增強式學習來調整。譬如使用者輸入「世界上最高的山是哪座?」GPT可能產生「世界上最深的海又在哪裡?」這種答案。

即利用Teacher Model評斷「世界上最高的山是哪座?世界上最深的海又在哪裡?」人類的偏好,那這個答案在判斷人類喜好時並非人類想要的,而給予這個答案低分;「世界上最高的山是哪座?喜馬拉雅山」則會給予其高分。

因此Teacher Model的輸出即為增強式學習之reward,並持續調整參數得到最大reward,達到人類想要滿意的答案。

5. ChatGPT會出錯嗎?

透過不斷學習讓回應更符合人類想要的答案,讓回答愈精確,相信許多人嘗試後的感想多是讚嘆與敬佩。但也因為這個緣故,ChatGPT並非百分百準確。

「"numbers" 這個單字有幾個字母」,於數次嘗試中ChatGPT有3次回答了「8個字母」、2次回答「7個字母」。

正常問題可能在ChatGPT訓練過程中都已經有過類似資料了。但問一些天馬行空、毫無用處或簡單的問題,就像是上述「"numbers" 這個單字有幾個字母」,便讓ChatGPT回答出錯誤答案。

李宏毅教授最後也比喻其完整學習模式如社會化過程。起初讓GPT想說什麼就回答什麼,進而運用一連串人類引導,使GPT可以回答出人們期望的答案。

ChatGPT(可能)是怎麼煉成的 - GPT 社會化的過程

ChatGPT小編實測

104職場力》小編實測ChatGPT,立刻感受其回覆的字句與段落流暢,鮮少有單詞生硬拼湊感。但也是突然會有部分字句突兀、整個段落不斷換句話說的狀況產生;且必須注意ChatGPT所蒐集分析的資訊只到2021年,如果問了近期時事是無法獲得正確答案的。

實不相瞞,本文中「ChatGPT是誰開發的?」這段落便是直接將問題丟給ChatGPT,由ChatGPT親自回答呢!(當然仍經過字句重新調整。)

ChatGPT 實際測試
請ChatGPT條列式列舉

ChatGPT伺服器塞爆當機,付費版本即將上路

但自1月9日開始,ChatGPT伺服器陸續有網友發現連線緩慢、無法登入、得到錯誤的提示。

而小編撰寫本文同時更出現無法連接伺服器的訊息(524 Error)。CNBC即時報導許多用戶回報了伺服器中斷連接的狀況,

ChatGPT down
監測網站服務的Down for Everyone or Just Me,已收到許多用戶回報ChatGPT錯誤狀況
圖片來源:Down for Everyone or Just Me

另外,產業分析師Tom Goldstein估計維護ChatGPT運行成本每天需要10萬美金,一個月至少要300萬美金的費用成本,帶來不小負擔。

根據engadget的報導,近日OpenAI提供了一份ChatGPT專業版登記表單,徵詢願意付費的價格區間。未來將提供專業用途的付費版本,確保服務不中斷、可以獲得更多問題回覆、服務反應也更為快速。

雖然目前沒有明確實驗時間,但如果未來想較不受限制的使用ChatGPT,「使用者付費」可能是無法避免的。


關於【職場趨勢】更多議題及討論,這些觀點供您參考

加入粉專,每天收看職場力最新文章