OpenAI近日正式推出「ChatGPT Images 2.0」,與過往模型相比,Images 2.0不僅能理解更複雜的視覺指令,還能局部編輯、調整長寬比,更首度將思考能力與影像創作結合,讓AI影像從單純的生成圖片,進化成具戰略設計能力的視覺工具,來看看有哪些特點吧!
文/《104職場力》
本文導覽
ChatGPT Images 2.0的最大亮點在於其「推理」特質,當使用者在ChatGPT中選擇「推理(Thinking)」或「Pro」模型時,影像生成過程會有以下進階功能:
Images 2.0解決了過往AI生成圖最常見的痛點,能夠產出真正可直接投入使用的成品,包含以下特點:

過往圖片模型在非拉丁語系(如中、日、韓文)的文字呈現常出現亂碼或筆劃錯誤,Images 2.0強化了多國語言理解力,特別是繁體中文、日文、韓文、印地文及孟加拉文的表現更優異,這讓語文不再只是標籤,而是能完美融入海報、說明圖或圖表中,成為設計的一部分。
「局部編輯」和「彈性調整圖片比例」也是這次ChatGPT Images 2.0的重要亮點之一,為了滿足不同數位媒介的需求,Images 2.0提供了極高的靈活性,支援從極寬的3:1到極窄的1:3比例,無論是簡報投影片、社群媒體圖貼還是電子書籤都適配;另外,模型的知識庫截止日期更新至2025年12月,使用者在製作教學素材或資訊圖表時,能提供更精確且具時代感的內容。


除了ChatGPT介面,新模型也深度整合至各項開發工具:
gpt-image-2串接API,將高品質的自動化圖像生成功能導入第三方應用程式,如在地化廣告生成或創意自動化系統。OpenAI坦言Images 2.0仍非完美,因目前模型在處理「物理空間邏輯」方面仍具挑戰,例如摺紙步驟圖、魔術方塊邏輯,或是極度密集的細節(如沙灘上的沙礫),因此仍建議使用者在圖片生成後還是要進行人工審核。
ChatGPT Images 2.0目前已全面開放給所有ChatGPT與Codex使用者,但Thinking這項進階功能則優先提供給ChatGPT Plus、Pro及企業版(Business)用戶,API則依據影像品質與解析度設定採差別計費。
(資料來源:ChatGPT官網)
延伸閱讀: