3月12日,谷歌正式發布Gemini 2.0 Flash全模態圖像生成器,支持原生圖像生成功能。現在,所有開發者都可以通過Gemini API和Google AI Studio中的實驗版本使用Gemini 2.0 Flash進行原生圖像生成。
“嘮嗑式P圖”,修圖改圖“動口不動手”
據谷歌介紹,此外,其在世界理解方面,Gemini 2.0 Flash與傳統模型相比,具有明顯優勢。Gemini 2.0 Flash利用豐富的世界知識和增強的推理能力來生成圖像,值得一提的是,OpenAI前研究科學家威廉·古斯在社交媒體上感嘆道,“
多任務實測:生成圖文菜譜、制作生日賀卡、給漫畫上色等輕松拿捏
在Gemini 2.0 Flash原生圖像生成功能開放后,首先,經過五分鐘的等待,Gemini 2.0 Flash完成了然而,Gemini 2.0 Flash在運行過程中也出現了一些狀況。當
隨后,不過,
待Gemini 2.0 Flash完成處理后,
這次模型很快輸出了結果。隨著
Gemini 2.0 Flash同樣很好地完成了任務。中,服裝完美適配男性模特身形,且背景色也被準確替換為橙色,整體效果自然流暢,毫無違和感。
不僅如此,當Gemini 2.0 Flash還具備一項技能——生成圖文并茂的菜譜。為測試其實際表現,
可以看到,模型不僅完整且條理清晰地呈現出了“番茄炒蛋”的菜譜,從食材準備、烹飪步驟到火候掌控等信息一應俱全,還在菜譜相應位置精準插入了與之匹配的。值得注意的是,在圖像生成領域,眾多模型在應對長段文本處理時,常陷入格式不佳、字符模糊難辨或錯別字頻出等問題。Gemini 2.0 Flash在這方面的表現如何呢?
約十秒鐘后,Gemini 2.0 Flash便生成了一張設計精美的生日賀卡。仔細查看,賀卡上不僅完整涵蓋了總體來看,Gemini 2.0 Flash原生圖像生成功能的表現可圈可點,雖有一些小瑕疵,但為圖像生成技術的應用拓展了邊界。