Midjourney,作為網絡上最早的 AI 圖像生成服務之一,最近發佈了近一年來的首個新 AI 圖像模型,命名為 V7。該模型於美東時間週五午夜開始以 alpha 版本推出,此次發佈恰逢 OpenAI 在 ChatGPT 中推出新圖像生成器,該生成器因能創造出 Ghibli 風格的照片而迅速走紅。雖然 Midjourney 的 V7 並非專為 Ghibli 風格優化,但仍然能生成美觀的作品,至少對於本報記者的業餘眼光來說如此。
使用 V7 之前,用戶需先評分約 200 張圖像,以建立 Midjourney 的「個性化」檔案。如果尚未完成,該檔案會根據用戶的視覺偏好來調整模型;V7 是 Midjourney 首個預設開啟個性化功能的模型。
完成評分後,用戶可以在 Midjourney 的網站上以及其 Discord 聊天機器人中選擇 V7。在網頁應用中,用戶可從「版本」標籤旁的下拉菜單中快速選擇該模型。
Midjourney CEO David Holz 在 X 平台上的一篇帖子中形容 V7 為「完全不同的架構」。他在 Discord 上的公告中提到:「V7 在文本提示方面更為智能,圖像質量明顯提高,質感美麗,身體、手和各類物體的細節一致性也顯著改善。」
V7 提供兩種模式,Turbo 和 Relax,其中 Turbo 模式的運行成本較高,並支持一個名為 Draft Mode 的新工具,該工具以標準模式的十倍速度和一半的成本渲染圖像。雖然 Draft 模式生成的圖像質量低於標準模式,但可通過一次點擊進行增強和重新渲染。
根據 Holz 的說法,目前 V7 尚未具備一些功能,包括圖像放大和重新上色。這些功能預計在不久的將來推出,可能在兩個月內實現。
Holz 在 Discord 上寫道:「這是一個全新的模型,具有獨特的優勢和可能的幾個劣勢。我們希望從用戶那裡了解它的優缺點,但請務必記住,它可能需要不同風格的提示。因此,建議多加嘗試。」
Midjourney 自 2022 年由 Holz 創立以來,並未接受任何外部資金支持。據報導,Midjourney 在 2023 年底預計將實現約 2 億美元的收入。最近,這家位於舊金山的公司表示正在建立一個硬件團隊,負責未公開的項目,並持續訓練之前宣布的視頻和 3D 物體生成模型。
不過,Midjourney 也面臨多起訴訟,指控其在未經圖像創作者同意的情況下,使用從網絡上抓取的圖像來訓練 AI 工具,侵犯了數百萬藝術家的權利。
日本電話卡推介 / 台灣電話卡推介
一㩒即做:香港網速測試 SpeedTest HK




