fbpx

將文字化為超現實圖片,OpenAI 發表 AI 生成模型 DALL-E 2

將文字化為超現實圖片,OpenAI 發表 AI 生成模型 DALL-E 2
                                       

輸入一段簡單的文字敘述,即使不符常理,AI 也能將文字生成超現實的圖片,比如「灌籃的無尾熊」或「彈吉他的北極熊」——這是去年年初 OpenAI 展示的機器學習模型 DALL-E 1,名稱為藝術家達利(Dali)與迪士尼動畫角色瓦力(WALL-E)的組合字。

4 月 6 日,OpenAI 發表改良後的 DALL-E 2 ,除了生成圖片更為清晰之外,還能根據一張圖片製作出不同角度的版本,同時也加入防止濫用機制。


圖片來源/OpenAI

 

相較去年的版本,新的 DALL-E 2 能夠以 4 倍解析度生成更逼真、準確的圖片,這包括更複雜的背景、景深效果、逼真的陰影,光線反射等。DALL-E 2 另一項功能為圖像修復(inpainting),將圖中指定的區域替換為想要的樣貌,比如「吹蠟燭的猴子」改為「吹蠟燭的猴子,戴著有趣的帽子」。DALL-E 2 甚至能將一張照片生成不同角度、風格的版本。

 

根據 OpenAI 影片旁白:「DALL-E 是經過圖片及圖片文字敘述的神經網絡訓練而成。借助深度學習,它不僅能理解個別物體,比如無尾熊與摩托車,還能夠理解二者間的關聯。」因此當你輸入「騎著腳踏車的無尾熊」,DALL-E 便能在幾秒內憑空生出多張類似的圖片。

儘管 DALL-E 能夠生成任何你能想到的東西,但它仍有一些限制。OpenAI 研究人員為減少深度偽造(deepfake)、濫用 AI 生成技術帶來的風險,刻意在訓練資料庫中刪除關於仇恨、情色、暴力等內容,甚至禁止 AI 生成真實存在的臉孔。

OpenAI 表示,DALL-E 2 存在的目的有兩點:一是賦予人們以更有創意的方式表達自己的能力;其次是理解人工智慧系統是如何看待我們的世界。腦中雖然有許多瘋狂的點子,但礙於自身技術不足,難以化為現實,應該是不少人都有過的經驗,比如遊戲從業人員在開發一款新遊戲時,會需要繪製遊戲場景的概念圖,這時 DALL-E 便能派上用場。不過,目前 DALL-E 2 僅開放給少數的專家測試,隨著版本不斷迭代,將來可望開放給更多人使用。

網路快訊

叫我小高就好了。聯絡方式:8bitgaoooo@gmail.com

More in 網路快訊

Google 宣布:Android 12 的手機都支援 iOS「轉移到 Android」app

Candice Chao2022-06-30

光刻機?曝光機?從製程特性聊怎麼稱呼更合理

Kisplay2022-06-30

CASETiFY 皮革系列手機殼家族加入 2 款新成員 由 90% 可回收物料製成!

Candice Chao2022-06-29

Airbnb 宣布永久禁止房客開趴

高伯任2022-06-29

LINE 換機新選擇: 掃描行動條碼換機教學 iOS / Android 跨系統也行!

Candice Chao2022-06-28

不只智慧型手機 高通打造 WiFi 7 射頻前端模組 滿足各項聯網設備

Kisplay2022-06-28