OpenAI推出ChatGPT Images 2.0支援多語言、思考精準度再升級!

104職場力
1天前
1425次觀看

OpenAI近日正式推出「ChatGPT Images 2.0」,與過往模型相比,Images 2.0不僅能理解更複雜的視覺指令,還能局部編輯、調整長寬比,更首度將思考能力與影像創作結合,讓AI影像從單純的生成圖片,進化成具戰略設計能力的視覺工具,來看看有哪些特點吧!

文/《104職場力

本文導覽

1.結合思考能力,支援網頁搜尋與多圖生成

ChatGPT Images 2.0的最大亮點在於其「推理」特質,當使用者在ChatGPT中選擇「推理(Thinking)」或「Pro」模型時,影像生成過程會有以下進階功能:

  • 即時資訊查詢:模型可透過網頁搜尋獲取最新資訊,確保影像內容(如教學圖表、新聞摘要)符合時事。
  • 多圖同步生成:支援單次指令生成最多8張具備連貫性的影像,適用於漫畫分鏡、室內設計多方案對比或系列海報設計。
  • 自我修正機制:在生成過程中,模型會先行構思影像結構並反覆核對輸出,大幅降低指令理解偏差。


2.精準度大幅提升,複雜構圖也沒問題

Images 2.0解決了過往AI生成圖最常見的痛點,能夠產出真正可直接投入使用的成品,包含以下特點:

  • 能處理更精細的元素:包含更小字體的文字、圖示、UI使用者介面元件,以及密集的構圖排列。
  • 擬真的視覺風格:顯著提升了照片的真實感(包含細微的自然瑕疵),並能精準捕捉電影劇照、像素藝術(Pixel Art)及漫畫(Manga)等特定風格。
  • 高解析度:透過API串接,最高可支援2K解析度的影像輸出。

▲104職場力小編實測,用ChatGPT Images 2.0生成宣傳圖,排版和小字、細節都處理得很好。


3.支援多語系,繁體中文顯示更流暢

過往圖片模型在非拉丁語系(如中、日、韓文)的文字呈現常出現亂碼或筆劃錯誤,Images 2.0強化了多國語言理解力,特別是繁體中文、日文、韓文、印地文及孟加拉文的表現更優異,這讓語文不再只是標籤,而是能完美融入海報、說明圖或圖表中,成為設計的一部分。


4.可局部編輯、調整圖片比例,創作更彈性

「局部編輯」和「彈性調整圖片比例」也是這次ChatGPT Images 2.0的重要亮點之一,為了滿足不同數位媒介的需求,Images 2.0提供了極高的靈活性,支援從極寬的3:1到極窄的1:3比例,無論是簡報投影片、社群媒體圖貼還是電子書籤都適配;另外,模型的知識庫截止日期更新至2025年12月,使用者在製作教學素材或資訊圖表時,能提供更精確且具時代感的內容。

ChatGPT Images 2.0生成圖片後,可進行局部編輯。
▲ChatGPT Images 2.0生成圖片後,可進行局部編輯。

編輯時點選右上角「長寬比」即可調整比例大小;也可以直接在對話框中下達Resize的指令。
▲編輯時點選右上角「長寬比」即可調整比例大小,也可以直接在對話框中下達Resize的指令。


5.整合Codex與API開發應用

除了ChatGPT介面,新模型也深度整合至各項開發工具:

  • Codex工作區:設計師與行銷人員可在Codex內直接生成UI原型或廣告草案,並快速迭代至產品端,無需切換工具。
  • API正式上線:開發者可透過gpt-image-2串接API,將高品質的自動化圖像生成功能導入第三方應用程式,如在地化廣告生成或創意自動化系統。

OpenAI坦言Images 2.0仍非完美,因目前模型在處理「物理空間邏輯」方面仍具挑戰,例如摺紙步驟圖、魔術方塊邏輯,或是極度密集的細節(如沙灘上的沙礫),因此仍建議使用者在圖片生成後還是要進行人工審核。

訂閱方案與供應狀況

ChatGPT Images 2.0目前已全面開放給所有ChatGPT與Codex使用者,但Thinking這項進階功能則優先提供給ChatGPT Plus、Pro及企業版(Business)用戶,API則依據影像品質與解析度設定採差別計費。

(資料來源:ChatGPT官網


延伸閱讀:

職場專業情報第一選擇:履歷範本、自傳範例、求職面試、職場溝通、經營管理、工作心法、職涯規劃、中年失業、就業機會等。不只幫你找工作、找方向,更要提升你的職場競爭力。新鮮人、上班族、二度就業必看!