AIとICTの進歩的探求

AIの進化や革新的なテクノロジーにフォーカスし、わかりやすく解説していきます。

進化する画像生成AI Grok & ImageFX

進化する画像生成AI | GrokとImageFXの比較レビュー

最近の画像生成AIの進化は凄いですね… 今回は、特に最近注目されている画像生成AIの「Grok」と「ImageFX」を比べていきたいと思います。

目次

1. 始め方

まずは、それぞれの画像生成AIの始め方を紹介します。

Grok

「Grok」は、SNSの「X」で有料プランに入っていれば使用できるAI機能です。画像だけにこだわったものではないのですが、機能の一つとして画像が生成可能です。

Xにログイン後、メニューの左側に「Grok」という項目がありますのでそこをクリックすることで使用が可能になります。※スマホ側では「プレミアム」という項目の中にあります。

ImageFX

「ImageFX」とは、Googleが提供している新しい画像生成AIになります。Googleが公開しているAI Test Kitchenというプラットフォーム上で使用が可能です。

※AI Test Kitchenは、Googleが提供する最新AIテクノロジーを利用できるプラットフォームです。話題の最新AIツールが利用できます

以下からアクセスしてみてください:

ImageFX

画面右上の「sign in with Google」をクリックして自前のGoogleアカウントを連携させれば利用可能です。

2. それぞれの背景

それぞれの画像生成AIの背景について詳しく見ていきましょう。

Grok

FLUX.1が組み込まれています。FLUX.1は、「Stable Diffusion」を作ったチームが新しく立ち上げた「Black Forest Labs」という会社が開発しました。プロンプトへの追従性と対応力を兼ね備えた高性能な画像生成AIモデルです。

ImageFX

Imagen 3が組み込まれています。これはGoogleで開発した画像生成AIです。これをGeminiを経由せずブラウザだけで使用できるようにしたものがImageFXになります。

3. 特徴

Grok

Grokは写真系、アニメ風どちらにも強く、文字を画像の中に組み込む表現力が高いです。また、指示に対する感度も非常に高いと感じます。ChatGPTの「DALLE3」も良かったのですが、正直それを超えるレベルになっています。

デメリットとしては以下が挙げられます:

  • 日本語でのプロンプト×
    日本語でプロンプト入力すると、全く意図しない画像が生成されることがあります。英語のプロンプトを推奨します。
  • 絵柄の固定化が△
    SEED値の固定ができないため、絵柄の固定が難しいです。体感では約30%の絵柄固定率です。

ImageFX

ImageFXも写真系、アニメ風どちらにも強いですが、特に写真系の表現が非常に自然で、見分けがつかないほどのクオリティです。Grokとの違いは、シード値を表示してロックすることで、画風をある程度固定できる点です。

デメリットとしては以下が挙げられます:

  • 日本語でのプロンプト×
    日本語のプロンプト入力では、期待した結果が得られない場合が多いです。翻訳サイトを利用して英語に変換してから使用しましょう。

4. 比較画像

ここに比較画像を挿入します。

5. 商用利用

両方とも素晴らしい画像生成AIですが、商用利用については注意が必要です。

ImageFX

直接的には商用利用について言及されていませんが、Googleの規約に同意する必要があります。以下の行為が禁止されています:

  • 生成 AI のコンテンツを人間が作成したものであると誤解させる行為
  • 機械学習モデルまたは関連する AI テクノロジーの開発を目的とした、Google サービスの AI 生成コンテンツの使用

Grok

Grokも「グレー」扱いです。内蔵しているFLUX.1がどれなのかが不明で、FLUX.1 Proであれば商用利用は可能ですが、それ以外は個人使用に限られます。

6. まとめ

画像生成AIの進化は止まることなく続いています。慣れたころには次の技術が登場するかもしれません…。