世界熱點!瘋狂的繪畫AI Dall E!可以補充畫面之外的內(nèi)容


(資料圖片)

OpenAI為其文本到圖像的人工智能模型DALL-E增加了一個新的 "outpointing "功能,讓該系統(tǒng)產(chǎn)生新的視覺效果,擴大任何給定圖片的邊界。

在上面的例子中,你可以看到DALL-E如何在人類提示的幫助下,"想象 "出約翰內(nèi)斯-維米爾的肖像畫 "戴珍珠耳環(huán)的女孩 "的框架外的東西。請注意,即使從畫像提供的有限信息來看,該系統(tǒng)也能與維米爾的風(fēng)格相匹配,模仿出原作的陰影和高光。

在下面的時間推移中,你還可以看到負(fù)責(zé)的藝術(shù)家奧古斯特-坎普是如何每次都要在小范圍內(nèi)擴展圖像,為了得到她想要的結(jié)果,經(jīng)常重做DALL-E的幾代。在這段視頻中沒有看到,但絕對值得強調(diào)的是,該系統(tǒng)并不只是自己生成這些擴展的事實。與所有文本到圖像的人工智能一樣,該模型需要人類來描述新的視覺效果。

Outpainting作為一個功能可以用來擴展原始內(nèi)容,當(dāng)然,許多DALL-E用戶已經(jīng)在玩這個功能,看看著名圖像的框架之外有什么。(向下滾動到底部看我絕對喜歡的例子...)

從更廣泛的角度來看,畫外音并沒有真正擴大文本-圖像人工智能系統(tǒng)的基本功能,但它確實顯示了OpenAI將如何在這些系統(tǒng)不斷增長的市場中定位自己:通過使可用性成為對客戶的關(guān)鍵宣傳。

許多文本到圖像的人工智能模型可以執(zhí)行相同的基本功能,但就像這次更新之前的DALL-E本身一樣,它需要相當(dāng)多的手工擺弄。盡可能地使外繪變得簡單,將有助于DALL-E從Midjourney和Stable Diffusion等規(guī)模較小但具有可比性的系統(tǒng)日益激烈的競爭中脫穎而出。

DALL-E本身現(xiàn)在可以通過一個測試項目使用,目前有超過一百萬的用戶可以使用。每個測試版用戶在第一個月可以獲得50個免費的圖像世代,之后每個月可以額外使用15個。然后他們可以花15美元購買115個額外的圖像世代。

不過,在此期間,畫外音可以用來回答生活中的一些最大的謎團,比如,"如果貴格燕麥的人是一個胸大無腦的酒吧女郎呢?" 不要再想了。

推薦DIY文章
2022款iPadPro將可使用視頻編輯軟件達(dá)芬奇 使用軟件更專業(yè)
蘋果全新推出AppleTV 4K產(chǎn)品:流式傳輸可以千兆以太網(wǎng)進行
智己L7SnakePerformance高性能版:新車瞄準(zhǔn)數(shù)秒級圈速提升
閃迪大師PRO-G40SSD外置固態(tài)硬盤:兼具極速傳輸與耐用優(yōu)點
i9版ThinkBook14+/16+新品有望下月上市 首發(fā)約4999元起
512G M.2固態(tài)只要219元!沃存殺瘋了-環(huán)球快消息
精彩新聞

超前放送