Animagine XLとは?アニメ系イラストに特化した画像生成AIモデルの使い方

animagine-xl生成の女性画像

Stable Diffusionで画像生成するときに使われる人気モデルの一つ、Animagine XL。

しかし、以下のような方も多いかもしれません。

  • そもそもAnimagine XLが何なのか知りたい
  • Animagine XLでのプロンプトの書き方がわからない
  • バージョンごとの違いに興味がある

結論からいうと、Animagine XLはアニメ系イラストの生成に特化したモデルで、マンガやゲームに登場するキャラクターに対応している点が特徴です。

今回は、Animagine XLの特徴や使い方などについて、バージョン4.0を中心に解説します。

さまざまなキャラクターの画像を生成できるアニメ系イラストを探している方は、本記事をぜひ最後までご覧ください。

目次

Animagine XLとは?5つの特徴

ANIM4GINE
出典:CagliostroLab

Animagine XLとは、Stable Diffusionの環境で利用できる画像生成AIモデルシリーズです。

ここでは、Animagine XLが持つ以下5点の特徴について解説します。

  • アニメ系イラストに特化した画像生成AIモデル
  • 特殊なタグで画風を変えられる
  • Stable Diffusion XL 1.0を基に学習している
  • 商用利用が可能である
  • バージョン4.0が2025年1月27日に公開されている

1.アニメ系イラストに特化した画像生成AIモデル

Animagine XLは、アニメ風のイラスト生成に特化した画像生成AIモデルです。

アニメやマンガのスタイルに特化したデータセットでトレーニングされており、キャラクターの表情やポーズ、線画のクオリティが高いのが特徴。

また、特定のキャラクター名と作品名をプロンプトで指定することで、Animagine XLモデル単体で版権キャラクターのイラストを生成できます

年代や品質が異なる多様なスタイルに対応しているため、ユーザーの好みに合わせた表現に変更することも可能です。

2.特殊なタグで画風を変えられる

Animagine XLでは独自のタグが用意されており、プロンプトに入力することで自由に画風を変えられます

たとえば、以下のような種類のタグが使えます。

  • 品質タグ
  • スコアタグ
  • 時間タグ
  • レーティング

複数のタグを組み合わせて使うことで「2025年風の高品質な全年齢向け」といった指定が可能です。

詳しい記述方法については後述します。

3.Stable Diffusion XL 1.0を基に学習している

Animagine XLは、Stable Diffusion XL(SDXL)1.0を基に学習されたモデルです。

SDXLは、通常のStable Diffusionよりも高解像度の画像を生成できるように設計されており、以下の特徴があります。

  • 1024×1024pxの高解像度で画像生成できる
  • キャラクターの表情や髪の毛、衣装がより細かく描写できる
  • キャラクターの手や顔の崩れが少なく、安定した構図になりやすい

通常のStable Diffusion向けに作られた拡張機能やモデルが使えない場合があるので、SDXL系モデルを使い慣れていない場合は注意してください。

SDXLについて詳しく知りたいのであれば、以下の記事を参照すると良いでしょう。

SD3.5を基にしたモデルAnimaestroも開発中

Animagine XLを提供しているCagliostro Research Labは、Stable Diffusion 3.5を基にした新モデルAnimaestroを開発しています

Cagliostro Research Lab生成の女性画像
出典:CagliostroLab

SDXLを基にしたAnimagine XLと差別化するため、AnimeとMaestroを組み合わせたモデル名にしたそうです。

2025年6月までを目処にリリースする予定とのことなので、こちらのモデルについてもチェックしてみてください。

4.商用利用が可能である

Animagine XLは、商用利用が可能な画像生成AIモデルです。

個人・法人問わず、生成した画像をイラスト制作や広告、書籍、ゲーム開発などの商業プロジェクトに使用できます。

ただし、有害コンテンツの生成など禁止事項もあるので、とくに商用利用する際は要注意です。

詳しくはCreativeML Open RAIL++-Mライセンスを参照してください。

ちなみに、このライセンスはStable Diffusion XLに適用されているものと同じです。

版権キャラクターを使う際は要注意

Animagine XLでは版権キャラクターに似た画像を簡単に生成できますが、著作権や商標権を侵害しないよう注意しなければなりません

生成した画像自体は商用利用が認められているものの、著作権や商標権を侵害すると訴えられる可能性があります。

以下のようなケースは問題になりやすいので、極力避けるようにしましょう。

  • 有名なアニメキャラクターをそのまま描写した画像を商用利用する
  • 公式イラストと誤解されるような画像を制作して販売する
  • 企業のロゴやマスコットキャラクターを含む画像を共有する

5.バージョン4.0が2025年1月27日に公開されている

Animagine XLは継続的にアップデートされており、2025年1月27日にAnimagine XL 4.0(別名Anim4gine)が公開されました

Animagine XLの画面
出典:Civitai

これまでのバージョン(3.1や3.0など)では前バージョンに基づいて学習されてきたため、すべてのデータが引き継がれてきています。

しかしAnimagine XL 4.0は、Stable Diffusion XLから直接トレーニングされているのが特徴です。

2025年1月7日までのゲームやアニメの知識を備えているため、前バージョンである3.1以上に多くの人気キャラクターを生成できます。

今後もバージョンが進むごとに、生成できるキャラクターの数やスタイルのバリエーションが増えていくでしょう。

Animagine XL 4.0(Anim4gine)の使い方・プロンプト例

Animagine XLの画面
出典:HuggingFace

執筆時点で最新バージョンのAnimagine XL 4.0(別名Anim4gine)の使い方やプロンプト例について解説します。

HuggingFaceで用意されているスペースにアクセスすると、無料でデモ版が利用できます。

「Prompt」欄にプロンプトを記述し「Generate」ボタンを押して画像を生成しましょう。

Animagine XLの画面
出典:HuggingFace

以下では、Animagine XL 4.0特有のプロンプトの書き方を、以下の順に解説していきます。

  • 基本的なプロンプト
  • 品質タグ
  • スコアタグ
  • 時間タグ
  • レーティングタグ

Animagine XLで推奨される設定

ローカル環境のように設定を変更できる環境で画像を生成する際は、以下のパラメータが推奨されています

CFGスケール5~7(6を推奨)
サンプリングステップ25~28(25を推奨)
サンプラーEuler Ancestral(Euler a)
解像度(画像サイズ)1024×1024(1:1)1152×896(9:7)1216×832(3:2)1344×768(7:4)1536×640(12:5)896×1152(7:9)832×1216(2:3)768×1344(4:7)640×1536(5:12)

SDXLを基に学習されているため、解像度が512×512だと良い結果が得られない点に注意してください。

1.基本的なプロンプト

Animagine XL 4.0では、以下のプロンプト構成が基本です。

  • 1girl/1boy/1other, キャラクター名, 作品名, レーティングタグ, その他の要素, 品質タグ, スコアタグ

たとえば、モデルのイメージにも使われている新世紀エヴァンゲリオンのアスカを生成したい場合は「1girl, souryuu asuka langley, neon genesis evangelion」のように記述してください。

タグなど他の要素を追加したいときは、基本プロンプトの後に付け足すと良いでしょう。

Animagine XLの画面
出典:CagliostroLab

また、ネガティブプロンプトに以下を入力することが推奨されています。

  • lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry

2.品質タグ

作品全体の品質に直接影響を与えるタグです。

以下の品質タグが用意されており、複数を重ねて使うこともできます。

  • masterpiece
  • best quality
  • low quality
  • worst quality
Animagine XL 4.0生成画像の比較

プロンプトの最後に記述することが推奨されているので、最初に書かないよう注意してください。

3.スコアタグ

品質に影響を与えるタグで、品質タグと比べて細かく制御できます

以下のスコアタグが使えるので、品質タグと並べて記述しましょう。

  • high score
  • great score
  • good score
  • average score
  • bad score
  • low score
Animagine XL 4.0生成画像の比較

高い品質の画像を生成したいときは、high scoreとgreat scoreを同時に書くのがおすすめです。

4.時間タグ

特定の年を指定することで、その年特有のスタイルで画像を生成できます

年を指定するときは、以下のようにプロンプトを書いてください。

  • year 2005

2005~2025の範囲で指定できるので、上記プロンプトの「2005」部分を変えていろいろなスタイルを試してみましょう。

Animagine XL 4.0生成画像の比較

5.レーティングタグ

生成する画像の安全性レベルを制御するタグです。

レーティングタグには以下が用意されており、下にいくほど過激なコンテンツになります。

  • safe
  • sensitive
  • nsfw
  • explicit
Animagine XL 4.0生成画像の比較

未成年者に有害なコンテンツを生成しないように、nsfwやexplicitをネガティブプロンプトに書くと良いでしょう。

Animagine XLの各バージョン比較

Animagine XL 4.0生成の女性画像

Animagine XLはバージョンごとに仕様などの違いがあります

ここでは4.0 や 3.1、3.0を比較したときの相違点について以下3点を解説します。

  • 使える特殊タグの違い
  • 学習した環境の違い
  • ライセンスの違い

1.使える特殊タグの違い

Animagine XLはバージョンによって使える特殊タグや書き方が異なります

タグ4.03.13.0
品質タグ・masterpiece
・best quality
・low quality
・worst quality
・masterpiece
・best quality
・great quality
・good quality
・normal quality
・low quality
・worst quality
・masterpiece
・best quality
・great quality
・good quality
・normal quality
・low quality
・worst quality
スコアタグ・high score
・great score
・good score
・average score
・bad score
・low score
美的タグ・very aesthetic
・aesthetic
・displeasing
・very displeasing
時間タグ(年代タグ)・year {n}・newest
・recent
・mid
・early
・oldest
・newest
・late
・mid
・early
・oldest
レーティングタグ・safe
・sensitive
・nsfw
・explicit
・safe
・sensitive
・nsfw
・explicit, nsfw
・rating: general
・rating: sensitive
・rating: questionable, nsfw
・rating: explicit, nsfw

複数のバージョンを利用するのであれば、スコアタグおよび美的タグの有無や、レーティングタグの書き方などに気を付けてください。

2.学習した環境の違い

3.1以前と4.0では、学習に使用した画像数や時間に大きな違いがあります。

3.1までのバージョンでは100万前後の画像を500GPU時間かけて学習していましたが、4.0では800万を超える画像の学習に2650GPU時間かけています

GPU時間とは?

GPUの数×学習にかかった時間 で算出される時間単位。

5つのGPUを用いて2時間学習した場合、学習時間は10GPU時間となる。

以上から、4.0は以前のバージョンを継承していないものの、学習量で引けを取っていないことがわかるでしょう。

ちなみに、その他の学習環境の比較は以下のとおりです。

比較4.03.13.0
ハードウェア(GPU)7 × H100 80GB SXM52 × A100 80G2 × A100 80G
学習した画像数8,401,464873,5041,271,990
学習時間約2,650GPU時間350GPU時間以上500GPU時間以上
UNet学習率2.5e-61e-57.5e-6
テキストエンコーダの学習率1.25e-61e-53.75e-6
スケジューラウォームアップ付き定常学習率(Constant with Warmup)コサインアニーリング・リスタート(Cosine Annealing Warm Restart)ウォームアップ付き定常学習率(Constant with Warmup)
ウォームアップのステップ5%サイクル数: 10、
最小 LR: 1e-6、
LR 減衰: 0.9、
最初のサイクル ステップ: 9,099
100
バッチサイズ3216×3×248×1×2
オプティマイザAdafactorAdamWAdafactor

3.ライセンスの違い

4.0はCreativeML Open RAIL++-Mライセンスであるのに対し、3.1と3.0はFair AI Public License 1.0-SD ライセンスの対象となっています

とはいえ、Fair AI Public License 1.0-SD は Stable Diffusion のライセンスと互換性を持つように設計されているため、CreativeML Open RAIL++-M との大きな違いはありません。

どちらのライセンスも商用利用、改変、配布、個人利用が認められているので、用途別にモデルを使い分ける必要はないでしょう。

ライセンスの禁止事項と要件

CreativeML Open RAIL++-M および Fair AI Public License 1.0-SD のライセンスでは、以下が禁止されているので注意してください。

適用される国内法、連邦法、州法、地方法、または国際法または規制に違反する方法。

未成年者を搾取し、危害を加え、または何らかの方法で搾取もしくは危害を加えようとする目的のため。

他人に危害を加える目的で、検証可能な虚偽の情報やコンテンツを作成または配布すること。

個人に危害を加えるために使用できる個人を特定できる情報を作成または配布すること。

他人を中傷、蔑視、またはその他の方法で嫌がらせすること。

個人の法的権利に悪影響を及ぼしたり、拘束力のある強制可能な義務を生み出したり変更したりする完全に自動化された意思決定のため。

オンラインまたはオフラインでの社会的行動、または既知または予測される個人的または性格的特徴に基づいて個人またはグループを差別したり傷つけたりすることを意図した、またはその効果を有する使用。

特定の集団の人々の年齢、社会的、身体的または精神的特徴に基づく弱点を悪用し、その集団に属する人々の行動を、その人または他の人に身体的または精神的危害を引き起こす、または引き起こす可能性のある方法で著しく歪曲すること。

法的に保護されている特性またはカテゴリーに基づいて個人またはグループを差別することを意図した、またはその効果を有する使用。

医療アドバイスおよび医療結果の解釈を提供するため。

個人が詐欺や犯罪の可能性を予測するなど、司法、法執行、移民または亡命手続きに使用される目的で情報を生成または配布すること(例:テキストプロファイリング、文書内の主張間の因果関係の解明、無差別かつ恣意的に対象を絞った使用など)。

引用元:Fair AI Public License 1.0-SD を翻訳

また、モデルをコピーしたり改変したりする際は、基となったモデルのライセンスを共有する必要があるので要注意です。

変更したモデルをネットワーク上でアクセスできるようにする場合は、ソースコードも提供しなければなりません。

その他の細かい点については原文をチェックしてみてください。

Animagine XLに関するQ&A

FAQ

Animagine XLに関する、よくある質問と回答を紹介します。

  • どんなキャラクターや作品が対応していますか?
  • Animagine XLはどこで使えますか?
  • ローカル環境(自分のPC)で利用するには?
  • 今後のバージョンアップ予定は?

どんなキャラクターや作品が対応していますか?

以下のリンク先で、Animagine XL 3.1に対応したキャラクターのリストを確認できます

https://huggingface.co/spaces/cagliostrolab/animagine-xl-3.1/resolve/main/wildcard/characterfull.txt

2025年2月時点では、Animagine XL 4.0のキャラクターリストは公開されていません。

そのため、4.0を利用している場合も3.1のリストを参考にすると良いでしょう

Animagine XLはどこで使えますか?

Animagine XLは以下の方法で利用できます

  • HuggingFaceのスペースにあるデモ版を使う
  • Civitaiなどで提供されている画像生成サービスを利用する
  • ローカル環境で環境を構築する
  • diffusersを利用する

高スペックPCを使って回数制限なく生成したい場合はローカル環境を、準備の手間なく利用したい場合はオンラインの画像生成サービスを、それぞれ利用すると良いでしょう。

公式のモデルカードではdiffusersの使い方が解説されていますが、画像生成するためにコードを記述する必要があるため敷居が高めです。

ローカル環境(自分のPC)で利用するには?

Stable Diffusionを自分のPCで利用するには、以下の手順で環境を整える必要があります

  1. インストールに必要なアプリを入手する
  2. Stable Diffusionをインストールする
  3. Animagine XLのモデルデータをダウンロードする
  4. ダウンロードしたモデルを指定された場所に置く

詳細な方法については以下の記事で解説しているので参照してください。

Animagine XL 4.0モデルは、こちらのページで入手することが可能です

OptとZeroの違いは?

OptとZeroは、どちらもAnimagine XL 4.0のモデルです。

モデル特徴ダウンロードページ
Opt追加のデータセットで学習・改良された汎用モデルhttps://civitai.com/models/1188071?modelVersionId=1408658
Zero追加学習前のベースモデルhttps://civitai.com/models/1188071?modelVersionId=1409042

通常の画像生成にはOptが向いており、Loraのような追加データのトレーニングにはZeroが適しています

今後のバージョンアップ予定は?

CagliostroLabのブログで公開されているロードマップによると、今後計画されているプロジェクトの計画は以下のとおりです。

2025 Q1 Animagine-XL v4.0(リリース済み)Animaestro 2B
2025 Q2Animagine-XL v4.1Animagine-XL v4.1 Flow
2025 Q3
2025 Q4開発にAIを利用したノベルゲーム

次のバージョンとなる4.1は、2025年のQ2(4月~6月)にリリースされるでしょう。

まとめ

Animagine XL 4.0生成の女性画像

本記事では、Animagine XLについて解説しました。

最後に、記事の内容をおさらいしておきましょう。

  • Animagine XLはアニメ系イラストに特価したStable Diffusion用の画像生成AIモデル
  • 版権キャラクターの生成にも対応しているが、商用利用には注意が必要
  • 特殊タグをプロンプトに書くことで画風を変えられる
  • バージョンによって特殊タグ、学習環境、ライセンスなどの違いがある

幅広いキャラクターや作品に対応しているAnimagine XLは、メインとして利用できるイラスト系モデルの有力な候補の一つです

キャラクターを指定しなくても利用できるので、アニメ系イラストのモデルを探しているのであればぜひ試してみてください。

お問い合わせ

お問い合わせ

metalandへのお問い合わせは以下のフォーム、もしくはLINE@よりお願いいたします。

  • LINE@:1〜2営業日以内にご返信させていただきます。
  • 問い合わせフォーム:3〜5営業日以内にご返信させていただきます。

記事のご制作依頼、広告掲載、プレスリリースなどお気軽にお問い合わせください。

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

「Metaland編集部」は、Web3.0、メタバース、AIといった最新のトピックを皆様にお届けします。専門知識がない方でもご心配は不要です。情報を深くかつ分かりやすく解説することを重視し、新しいデジタル時代への案内役となることを目指しています。一緒に新たなステップを踏み出しましょう!

目次