你聽過ChatGPT機器人嗎?ChatGPT是什麼?它是這幾個月網路討論極高的AI聊天機器人,它可以根據你的問題給予適當解答、說笑話、寫code、編故事、甚至請它幫程式debug除錯都沒有問題,可能比你同事還可靠。重點是,ChatGPT支援中文,而且語意還算流暢,本文有一段就是ChatGPT撰寫,你能猜出來嗎?
文/《104職場力》小編 整理
ChatGPT是透過機器學習(machine learning)中「自然語言處理技術」(Natural Language Processing, NLP)來實現相關功能。
利用人工智慧(Artificial Intelligence, AI)、數據分析(Data Analysis)和語言模型(Language Models)等技術,能夠理解用戶所送出的訊息,將輸入文字轉換成對應詞彙並組成語句,進一步進行回應。
ChatGPT由一家非營利性人工智慧公司「OpenAI」開發建置,其成立宗旨在於解決人類在科技上遇到的困境與問題,為未來AI研究創造基礎。而為了改善人類和機器間的互動,該公司由世界各地頂尖研究人員與學者組成,透過機器學習與學術研究開發人工智慧技術,為全球社會創造價值,也幫助人類對自然環境更加充分的理解。
而目前OpenAI主要開發的技術包含了:
ChatGPT具有自動建立關聯、細節識別、情緒識別等功能,可以輔助AI聊天機器人更加人性化的回應用戶話語,也更加精準的識別用戶提出的指令,為用戶解決問題:
而當前提供免費註冊使用,火熱引發話題下,當前已超過100萬名的使用者。然而服務運行所費不貲,免費服務有機會持續下去嗎?
那麼一定很好奇ChatGPT是如何辨識用戶提出的問題並字句流暢的回答?
ChatGPT所使用訓練邏輯模型和InstructGPT類似,前者透過GPT-3.5微調而成、後者則使用GPT-3,另外使用微軟Azure AI的超級運算進行訓練,經過大量資訊、文本與文意收集數據並分析。
而ChatGPT的學習方式,專精於語意理解、辨識及機器與深度學習的台大電機系副教授李宏毅從相似的InstructGPT說明,其可能具有4個學習階段:
透過當前收集到的資訊,推測接下來可能出現什麼字,並以此接續下去。
譬如「你好」這一個尚未完整的句子,透過網路上學習到的各種數據,後面就有可能接上「嗎」形成「你好嗎」;也可能接上「高」形成「你好高」;當然也可能是「美」形成稱讚對方「你好美」,而有許多種可能。
因此當輸入一個不完整的句子時,就可能產生許多種回答,有機率的每一次輸出都不同。不過單純利用文字接龍其實就可以回答問題,譬如:
詢問「台灣最高的山是哪一座?」,GPT便透過網路上蒐集的資料判斷接下來可能接上「玉」,再接上「山」,而形成「玉山」這個答案。
然而,實際上每次輸出都可能不同。從收集分析的資料也可能產生「玉山」以外的答案,如它爬到的資料是一道題目克能就出現了「(A)雪山 (B)玉山……」,或者輸出「誰來告訴我呀」等問句形式。
那如何引導GPT產生有用的輸出?
輸出結果可能不是使用者想要的答案,而為了精確就需要透過人工來思考問題、篩選正確的答案。
譬如「台灣最高的山是哪一座?」人們需要的答案是「玉山」,那麼透過篩選正確答案也就讓GPT不需要窮盡所有問題,蒐集資訊偏向人類的喜好。
接著就需透過Teacher Model將每次我們從GPT得到的回答判斷,譬如「台灣最高的山是哪一座?「玉山」及「台灣最高的山是哪一座?誰來告訴我呀」,Teacher Model目標去模仿人類老師喜好的標準。
如果是人類想要得到的答案,那該回答就會給予較高的分數。
最後用增強式學習來調整。譬如使用者輸入「世界上最高的山是哪座?」GPT可能產生「世界上最深的海又在哪裡?」這種答案。
即利用Teacher Model評斷「世界上最高的山是哪座?世界上最深的海又在哪裡?」人類的偏好,那這個答案在判斷人類喜好時並非人類想要的,而給予這個答案低分;「世界上最高的山是哪座?喜馬拉雅山」則會給予其高分。
因此Teacher Model的輸出即為增強式學習之reward,並持續調整參數得到最大reward,達到人類想要滿意的答案。
透過不斷學習讓回應更符合人類想要的答案,讓回答愈精確,相信許多人嘗試後的感想多是讚嘆與敬佩。但也因為這個緣故,ChatGPT並非百分百準確。
「"numbers" 這個單字有幾個字母」,於數次嘗試中ChatGPT有3次回答了「8個字母」、2次回答「7個字母」。
正常問題可能在ChatGPT訓練過程中都已經有過類似資料了。但問一些天馬行空、毫無用處或簡單的問題,就像是上述「"numbers" 這個單字有幾個字母」,便讓ChatGPT回答出錯誤答案。
李宏毅教授最後也比喻其完整學習模式如社會化過程。起初讓GPT想說什麼就回答什麼,進而運用一連串人類引導,使GPT可以回答出人們期望的答案。
ChatGPT(可能)是怎麼煉成的 - GPT 社會化的過程
《104職場力》小編實測ChatGPT,立刻感受其回覆的字句與段落流暢,鮮少有單詞生硬拼湊感。但也是突然會有部分字句突兀、整個段落不斷換句話說的狀況產生;且必須注意ChatGPT所蒐集分析的資訊只到2021年,如果問了近期時事是無法獲得正確答案的。
實不相瞞,本文中「ChatGPT是誰開發的?」這段落便是直接將問題丟給ChatGPT,由ChatGPT親自回答呢!(當然仍經過字句重新調整。)
但自1月9日開始,ChatGPT伺服器陸續有網友發現連線緩慢、無法登入、得到錯誤的提示。
而小編撰寫本文同時更出現無法連接伺服器的訊息(524 Error)。CNBC即時報導許多用戶回報了伺服器中斷連接的狀況,
另外,產業分析師Tom Goldstein估計維護ChatGPT運行成本每天需要10萬美金,一個月至少要300萬美金的費用成本,帶來不小負擔。
根據engadget的報導,近日OpenAI提供了一份ChatGPT專業版登記表單,徵詢願意付費的價格區間。未來將提供專業用途的付費版本,確保服務不中斷、可以獲得更多問題回覆、服務反應也更為快速。
雖然目前沒有明確實驗時間,但如果未來想較不受限制的使用ChatGPT,「使用者付費」可能是無法避免的。