相信很多人會接觸到「生成式 AI」技術,都是從「圖片生成」開始的吧!無論是 Modjourney、DALL.E,還是結合了 DALL.E 的 ChatGPT、Bing AI,利用文字生成圖片,一直很令人著迷。現在,Google Bard 終於也支援圖片生成了,而且「現在就可以使用」。
Google Bard 總算支援圖片生成,背後是 Imagen 2 技術
喜歡玩 AI 繪圖的人,現在有新的選擇了。除了最多人使用的 OpenAI DALL-E 3、Midjourney、Meta 的 Imagine with Meta AI,現在由 Google DeepMind 所開發的圖片生成技術「Imagen 2」也已經整合進去了 Google Bard 以及 Google 實驗室的 ImageFX 工具裏面。
由於 ImageFX 目前暫時沒有開放給台灣用戶嘗試,這邊主要就介紹 Google Bard with Imagen 2 功能了。依照 2023 年 5 月份 I/O 大會上的消息,Google 展示了 Imagen 2 令人驚艷的「逼真風格 AI 繪圖」,可以做到真假難辨的程度。
從 Google 官方的影片我們可以看到,Imagen 2 引擎可以生出品質相當不錯的圖片。
Google Bard AI 繪圖實際測試:目前只支援使用英文繪圖
經過我的簡單測試,我發現使用中文指令是無法成功讓 Google Bard 繪圖的,但是改成英文指令就「可能」可以。之所以說「可能」,是因為我還注意到,許多 DALL.E 3 可以理解並執行的指令,在 Google Bard 都繪圖失敗。
呵呵,還真是差別待遇。不是啦,開玩笑的,估計是 Google Bard 尚未在中文指令方面加入 Imagen 2 的圖片繪製功能。如果希望使用 Google Bard 來繪圖的話,可能要先將你的指令轉換成英文。
讓我們仔細看一下,上面 Google Bard 所生成的 AI 圖片:一隻開心的狗,牠的原圖細節如何。
這確實跟照片幾乎一模一樣了,你將這張圖片上傳到 Facebook、Instagram,估計也不會有人懷疑它是 AI 所生成的圖片。
Google Bard with Imagen 2 的知識庫似乎不足:很多指令無法實現
我在嘗試運用 Google Bard 生成圖片的時候,發現只要指令稍微複雜,它就很容易生成失敗了。無論是中國武俠風格的圖片,還是哈利波特魔幻風格的圖片,似乎都不容易生成成功。
我打個比方:
我第一次要求 Google Bard 繪製一張中國武俠風格的圖片,它回覆我做不到。但是我多增加一些細節,再嘗試一次,Google Bard 就畫出來了。在理解能力方面,似乎還是 OpenAI 的 DALL.E 3 要更強一些。
上面這張是 Google Bard 畫的中國水墨風格的劍客執劍行舟過河谷圖,跟其他的 AI 繪圖機制一樣,中文依舊被寫成天書文字。我用同一套指令,使用 ChatGPT DALL.E 3 來繪圖,得到的是下面這張照片:
誰好誰壞見仁見智,但 DALL.E 3 的圖片似乎細節更多一點。
有興趣的人,可以自行去 Google Bard 玩玩看。目前遊玩沒有任何限制,免費仔的天堂噢。
Google Bard:https://bard.google.com/
公開留言