fbpx

將文字化為超現實圖片,OpenAI 發表 AI 生成模型 DALL-E 2

將文字化為超現實圖片,OpenAI 發表 AI 生成模型 DALL-E 2
                                       

輸入一段簡單的文字敘述,即使不符常理,AI 也能將文字生成超現實的圖片,比如「灌籃的無尾熊」或「彈吉他的北極熊」——這是去年年初 OpenAI 展示的機器學習模型 DALL-E 1,名稱為藝術家達利(Dali)與迪士尼動畫角色瓦力(WALL-E)的組合字。

4 月 6 日,OpenAI 發表改良後的 DALL-E 2 ,除了生成圖片更為清晰之外,還能根據一張圖片製作出不同角度的版本,同時也加入防止濫用機制。


圖片來源/OpenAI

 

相較去年的版本,新的 DALL-E 2 能夠以 4 倍解析度生成更逼真、準確的圖片,這包括更複雜的背景、景深效果、逼真的陰影,光線反射等。DALL-E 2 另一項功能為圖像修復(inpainting),將圖中指定的區域替換為想要的樣貌,比如「吹蠟燭的猴子」改為「吹蠟燭的猴子,戴著有趣的帽子」。DALL-E 2 甚至能將一張照片生成不同角度、風格的版本。

 

根據 OpenAI 影片旁白:「DALL-E 是經過圖片及圖片文字敘述的神經網絡訓練而成。借助深度學習,它不僅能理解個別物體,比如無尾熊與摩托車,還能夠理解二者間的關聯。」因此當你輸入「騎著腳踏車的無尾熊」,DALL-E 便能在幾秒內憑空生出多張類似的圖片。

儘管 DALL-E 能夠生成任何你能想到的東西,但它仍有一些限制。OpenAI 研究人員為減少深度偽造(deepfake)、濫用 AI 生成技術帶來的風險,刻意在訓練資料庫中刪除關於仇恨、情色、暴力等內容,甚至禁止 AI 生成真實存在的臉孔。

OpenAI 表示,DALL-E 2 存在的目的有兩點:一是賦予人們以更有創意的方式表達自己的能力;其次是理解人工智慧系統是如何看待我們的世界。腦中雖然有許多瘋狂的點子,但礙於自身技術不足,難以化為現實,應該是不少人都有過的經驗,比如遊戲從業人員在開發一款新遊戲時,會需要繪製遊戲場景的概念圖,這時 DALL-E 便能派上用場。不過,目前 DALL-E 2 僅開放給少數的專家測試,隨著版本不斷迭代,將來可望開放給更多人使用。

網路快訊

叫我小高就好了。聯絡方式:8bitgaoooo@gmail.com

More in 網路快訊

ZOTAC 推出搭載 NPU 的全新 AI 迷你電腦,加速工作和創作

點子生活2024-03-29

華碩助力工業物聯網升級,推出強悍的 AI 解決方案

點子生活2024-03-29

Porsche Macan T,純粹駕馭樂趣的最佳詮釋

點子生活2024-03-29

三星 Galaxy Tab S6 Lite (2024):學生、上班族必備的行動神器

點子生活2024-03-27

Apple WWDC24 邀請函發出 6/11 將著重 Vision Pro 開發

Kisplay2024-03-27

華碩 Vivobook S 14/16 OLED:AI 筆電的新選擇

點子生活2024-03-27