股票
ChatGPT圖文生成再進化!GPT-4o完全免費,未來人人都能生成高品質圖片
撰文者:鉅亨網/編譯鍾詠翔 更新時間:2025-03-28
瀏覽數:2,715
圖片來源:達志影像
摘要
OpenAI執行長奧爾特曼週二(編按:3月25日)在直播活動中表示,正式推出基於GPT-4o模型的原生圖像生成功能,此項功能大幅升級OpenAI在生成式AI的地位。
ChatGPT上線多年後愈發雞肋的圖像生成功能,終於迎來歷史性升級。
OpenAI執行長奧爾特曼週二(編按:3月25日)在直播活動中表示,正式推出基於GPT-4o模型的原生圖像生成功能——模型直接從文本提示生成圖像,不再調用獨立DALL-E文生圖模型。
從週二開始,基於GPT‑4o的圖像生成功能向所有免費和付費用戶推出,未來幾週內開發者能通過API調用這項功能。
ChatGPT運用GPT-4o多模態能力,在圖像生成時能更加精確遵循指示,更精確渲染圖像上的文字。
ChatGPT於2022年底上線,最初只能進行文字聊天。大約1年後,OpenAI發布第3代圖像生成模型DALL-E 3,並集成到ChatGPT,但兩者一直是互相獨立的系統。
在新鮮感過去後,AI圖像生成器「理解提示詞能力差」,特別是「無法準確生成圖片中的文字」,嚴重阻礙這項功能在教育、職場等領域的應用。
隨著今年阿里巴巴(美股代號:BABA) 、Google(美股代號:GOOG)先後推出能準確生成文字的文生圖模型,OpenAI終於補上這個短板。
OpenAI在週二演示中展示了新一代ChatGPT的圖像功能升級到何種程度。
首先,ChatGPT已經能夠大致準確地按照提示詞,生成圖像中的文本。在演示中,AI成功按照要求生成一整頁的講話文本,沒出現錯別字。
奧爾特曼感慨,能在圖像生成功能中完美呈現文字本不應該是那麼令人讚嘆的事情,但他們卻等了這麼久。
從官方給出的更多示例來看,不管是生成黑板板書,還是印刷體、展示科學常識的繪圖,ChatGPT在生成圖像文字領域終於從完全不能用,達到接近商用的程度。
同時,ChatGPT的圖像編輯功能,也變得更加有用。
在演示中,2名研究人員與奧爾特曼合影,然後要求ChatGPT將合照轉化為動畫畫風。
結合GPT-4o的知識庫和終於能把字寫清楚的能力,ChatGPT也能通過簡單的提示詞,生成有關相對論的漫畫彩圖。
說到漫畫,現在ChatGPT也能根據漫畫草稿,一鍵生成上完色成品,也支援上傳圖片更換漫畫裡的主要角色。
從商業應用方面來講,現在模型也能根據用戶上傳的照片和卡片模板,自定義組合生成新的卡片,並按照要求展示圖片和文字。
GPT‑4o也可以根據聊天上下文的基礎來生成圖片和文字,所以生成的一系列圖像將具有一致性,這對設計遊戲角色而言相當重要。
本文經授權轉載自「鉅亨網」,原文:ChatGPT文生圖功能重大升級:準確生成文字 商用邊界大幅拓展
臉書粉絲專頁,請按此
延伸閱讀
▶中信金EPS創新高,「2元金」成真?艾蜜莉:投資真諦是陪好公司穩穩成長
▶新光金今年配息不再「掛蛋」?新光金:特別股擬發股利、普通股待綜合考量
▶現金股利、股票股利、還原殖利率怎麼算?存股族不能不知道
您可能有興趣的文章