Google Gemini 現已能創作 AI 生成的睡前故事

Google 在其 Gemini AI 聊天機器人中推出了一項新工具,名為「Storybook」,使用戶可以僅通過描述來創建插圖故事。此功能能生成 10 頁的故事,每頁包含一段短文,Gemini 可以朗讀,並附有相應的插圖。

用戶可以要求 Gemini 根據特定的藝術風格來定制故事,例如受黏土動畫、動漫、漫畫等啟發的風格。此外,Google 還允許上傳照片和其他圖像作為參考,例如上傳孩子的畫作,並要求 Gemini 為其創建故事。

為了親自體驗這些功能,首先請求 Gemini 創作一個關於一條鯰魚在新水族箱中努力交朋友的故事。翻閱「頁面」時,發現它生成的情節,關於水族箱內的生物試圖移動一顆大理石,讓人覺得有些乏味。但除此之外,整體看來這個 AI 生成的兒童故事還算標準,直到遇到一幅插圖,卻在某條魚上放置了一隻人手。

另一個由 Gemini 生成的故事中,一頁看起來像是意大利麵醬的卡通犯罪現場,而一幅描繪母子在看電視的 AI 圖像,卻將螢幕放在錯誤的一側。同事 Andrew Liszewski 甚至在 Google 自己的功能介紹視頻中發現了一些 AI 生成的奇異之處,視頻中顯示一名女性在建造太空船,並在手持扳手及其他工具時發出「敲、敲、敲」的聲音。

除了角色設計上的一些不一致外,在我要求 Gemini 創作的其他故事中,沒有發現其他明顯的 AI 異常。然而,當我上傳自己繪製的卡通貓圖像時,聊天機器人似乎並未理解我的藝術意圖。

Gemini Storybook 功能目前在桌面和移動設備上全球可用,涵蓋所有 Gemini 目前支持的語言。


十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。