米グーグルが新たな画像生成ツール、文章ではなく画像から「リミックス」
(CNN) 米グーグルが、人工知能(AI)を活用した新たな画像生成ツール「Whisk(ウィスク)」を発表した。利用者は、必要とするものの説明を文章で入力しなくても、アップロードした画像からAIが作り出したイメージを入手できる。
利用者が、被写体と設定、スタイルの画像を入力すると、ウィスクが全てを一つの画像に合成する。
グーグルはブログへの投稿で、ウィスクについて、「従来の画像エディター」とは異なり、素早いひらめきを得るための「創造的なツール」だと説明している。ウィスクは本質的に、洗練されたプロの仕事ではなく、楽しいAI機能を目指したものだ。
利用者は詳細を指示したい場合に文章を追加できるが、画像を作成する必要はない。
ウィスクはグーグルが2014年に買収したAI企業「ディープマインド」によって開発された生成AIに基づいて構築されている。
ウィスクは、グーグルのAI基盤モデル「Gemini(ジェミニ)」と、ディープマインドが発表した画像生成モデル「Imagen3」を組み合わせたもの。
利用者が画像をアップロードすると、ジェミニがImagen3に読み込ませるキャプションを生成する。この過程では正確な複製ではなく被写体の「本質」を捉えるため、最終的な画像のリミックスが可能となるが、最終的な画像が入力した画像から逸脱する可能性もある。
グーグルやオープンAIといったIT企業大手は、おしゃれな新技術の使い方を提示できる消費者向けの製品を発表しようと競っている。一方で、AIの開発に歯止めがないことが人類に危機をもたらすとの批判の声もある。