Animagine XLとは？アニメ系イラストに特化した画像生成AIモデルの使い方

Q: OptとZeroの違いは？

OptとZeroは、どちらもAnimagine XL 4.0のモデルです。 モデル特徴ダウンロードページOpt追加のデータセットで学習・改良された汎用モデル https://civitai.com/models/1188071?modelVersionId=1408658 Zero追加学習前のベースモデル https://civitai.com/models/1188071?modelVersionId=1409042 通常の画像生成にはOptが向いており、 Loraのような追加データのトレーニングにはZeroが 適しています 。

Q: 今後のバージョンアップ予定は？

CagliostroLabのブログ で公開されているロードマップによると、今後計画されているプロジェクトの計画は以下のとおりです。 2025 Q1 Animagine-XL v4.0（リリース済み）Animaestro 2B 2025 Q2Animagine-XL v4.1Animagine-XL v4.1 Flow 2025 Q3？2025 Q4開発にAIを利用したノベルゲーム 次のバージョンとなる4.1は、 2025年のQ2（4月～6月）にリリースされる でしょう。

2025 4/24

2025年2月26日 2025年4月24日

Stable Diffusionで画像生成するときに使われる人気モデルの一つ、Animagine XL。

しかし、以下のような方も多いかもしれません。

そもそもAnimagine XLが何なのか知りたい
Animagine XLでのプロンプトの書き方がわからない
バージョンごとの違いに興味がある

結論からいうと、Animagine XLはアニメ系イラストの生成に特化したモデルで、マンガやゲームに登場するキャラクターに対応している点が特徴です。

今回は、Animagine XLの特徴や使い方などについて、バージョン4.0を中心に解説します。

さまざまなキャラクターの画像を生成できるアニメ系イラストを探している方は、本記事をぜひ最後までご覧ください。

Animagine XLとは？5つの特徴

Animagine XLとは、Stable Diffusionの環境で利用できる画像生成AIモデルシリーズです。

ここでは、Animagine XLが持つ以下5点の特徴について解説します。

アニメ系イラストに特化した画像生成AIモデル
特殊なタグで画風を変えられる
Stable Diffusion XL 1.0を基に学習している
商用利用が可能である
バージョン4.0が2025年1月27日に公開されている

１.アニメ系イラストに特化した画像生成AIモデル

Animagine XLは、アニメ風のイラスト生成に特化した画像生成AIモデルです。

アニメやマンガのスタイルに特化したデータセットでトレーニングされており、キャラクターの表情やポーズ、線画のクオリティが高いのが特徴。

また、特定のキャラクター名と作品名をプロンプトで指定することで、Animagine XLモデル単体で版権キャラクターのイラストを生成できます。

年代や品質が異なる多様なスタイルに対応しているため、ユーザーの好みに合わせた表現に変更することも可能です。

２.特殊なタグで画風を変えられる

Animagine XLでは独自のタグが用意されており、プロンプトに入力することで自由に画風を変えられます。

たとえば、以下のような種類のタグが使えます。

品質タグ
スコアタグ
時間タグ
レーティング

複数のタグを組み合わせて使うことで「2025年風の高品質な全年齢向け」といった指定が可能です。

詳しい記述方法については後述します。

３.Stable Diffusion XL 1.0を基に学習している

Animagine XLは、Stable Diffusion XL（SDXL）1.0を基に学習されたモデルです。

SDXLは、通常のStable Diffusionよりも高解像度の画像を生成できるように設計されており、以下の特徴があります。

1024×1024pxの高解像度で画像生成できる
キャラクターの表情や髪の毛、衣装がより細かく描写できる
キャラクターの手や顔の崩れが少なく、安定した構図になりやすい

通常のStable Diffusion向けに作られた拡張機能やモデルが使えない場合があるので、SDXL系モデルを使い慣れていない場合は注意してください。

SDXLについて詳しく知りたいのであれば、以下の記事を参照すると良いでしょう。

meta land

SDXL（Stable Diffusion XL）とは？旧モデルとの違いや使い方を解説 | meta land SDXL（Stable Diffusion XL）は学習した画像のサイズや生成能力が向上したモデルデータで、Stable Diffusionと同様の方法で使い始められます。本記事では、SDXLの特徴や使…

SD3.5を基にしたモデルAnimaestroも開発中

Animagine XLを提供しているCagliostro Research Labは、Stable Diffusion 3.5を基にした新モデルAnimaestroを開発しています。

Cagliostro Research Lab生成の女性画像 — 出典：CagliostroLab

SDXLを基にしたAnimagine XLと差別化するため、AnimeとMaestroを組み合わせたモデル名にしたそうです。

2025年6月までを目処にリリースする予定とのことなので、こちらのモデルについてもチェックしてみてください。

４.商用利用が可能である

Animagine XLは、商用利用が可能な画像生成AIモデルです。

個人・法人問わず、生成した画像をイラスト制作や広告、書籍、ゲーム開発などの商業プロジェクトに使用できます。

ただし、有害コンテンツの生成など禁止事項もあるので、とくに商用利用する際は要注意です。

詳しくはCreativeML Open RAIL++-Mライセンスを参照してください。

ちなみに、このライセンスはStable Diffusion XLに適用されているものと同じです。

版権キャラクターを使う際は要注意

Animagine XLでは版権キャラクターに似た画像を簡単に生成できますが、著作権や商標権を侵害しないよう注意しなければなりません。

生成した画像自体は商用利用が認められているものの、著作権や商標権を侵害すると訴えられる可能性があります。

以下のようなケースは問題になりやすいので、極力避けるようにしましょう。

有名なアニメキャラクターをそのまま描写した画像を商用利用する
公式イラストと誤解されるような画像を制作して販売する
企業のロゴやマスコットキャラクターを含む画像を共有する

５.バージョン4.0が2025年1月27日に公開されている

Animagine XLは継続的にアップデートされており、2025年1月27日にAnimagine XL 4.0（別名Anim4gine）が公開されました。

これまでのバージョン（3.1や3.0など）では前バージョンに基づいて学習されてきたため、すべてのデータが引き継がれてきています。

しかしAnimagine XL 4.0は、Stable Diffusion XLから直接トレーニングされているのが特徴です。

2025年1月7日までのゲームやアニメの知識を備えているため、前バージョンである3.1以上に多くの人気キャラクターを生成できます。

今後もバージョンが進むごとに、生成できるキャラクターの数やスタイルのバリエーションが増えていくでしょう。

Animagine XL 4.0（Anim4gine）の使い方・プロンプト例

執筆時点で最新バージョンのAnimagine XL 4.0（別名Anim4gine）の使い方やプロンプト例について解説します。

HuggingFaceで用意されているスペースにアクセスすると、無料でデモ版が利用できます。

「Prompt」欄にプロンプトを記述し「Generate」ボタンを押して画像を生成しましょう。

以下では、Animagine XL 4.0特有のプロンプトの書き方を、以下の順に解説していきます。

基本的なプロンプト
品質タグ
スコアタグ
時間タグ
レーティングタグ

Animagine XLで推奨される設定

ローカル環境のように設定を変更できる環境で画像を生成する際は、以下のパラメータが推奨されています。

CFGスケール	5～7（6を推奨）
サンプリングステップ	25～28（25を推奨）
サンプラー	Euler Ancestral（Euler a）
解像度（画像サイズ）	1024×1024（1:1）1152×896（9:7）1216×832（3:2）1344×768（7:4）1536×640（12:5）896×1152（7:9）832×1216（2:3）768×1344（4:7）640×1536（5:12）

SDXLを基に学習されているため、解像度が512×512だと良い結果が得られない点に注意してください。

１.基本的なプロンプト

Animagine XL 4.0では、以下のプロンプト構成が基本です。

1girl/1boy/1other, キャラクター名, 作品名, レーティングタグ, その他の要素, 品質タグ, スコアタグ

たとえば、モデルのイメージにも使われている新世紀エヴァンゲリオンのアスカを生成したい場合は「1girl, souryuu asuka langley, neon genesis evangelion」のように記述してください。

タグなど他の要素を追加したいときは、基本プロンプトの後に付け足すと良いでしょう。

また、ネガティブプロンプトに以下を入力することが推奨されています。

lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry

meta land

Stable Diffusionのネガティブプロンプト一覧！使い方やおすすめも解説 | meta land Stable Diffusionで高品質な画像を生成するには、プロンプト（AIへの指示文）だけでなく、ネガティブプロンプトも活用する必要があります。ネガティブプロンプトを入力する…

２.品質タグ

作品全体の品質に直接影響を与えるタグです。

以下の品質タグが用意されており、複数を重ねて使うこともできます。

masterpiece
best quality
low quality
worst quality

プロンプトの最後に記述することが推奨されているので、最初に書かないよう注意してください。

３.スコアタグ

品質に影響を与えるタグで、品質タグと比べて細かく制御できます。

以下のスコアタグが使えるので、品質タグと並べて記述しましょう。

high score
great score
good score
average score
bad score
low score

高い品質の画像を生成したいときは、high scoreとgreat scoreを同時に書くのがおすすめです。

４.時間タグ

特定の年を指定することで、その年特有のスタイルで画像を生成できます。

年を指定するときは、以下のようにプロンプトを書いてください。

year 2005

2005～2025の範囲で指定できるので、上記プロンプトの「2005」部分を変えていろいろなスタイルを試してみましょう。

５.レーティングタグ

生成する画像の安全性レベルを制御するタグです。

レーティングタグには以下が用意されており、下にいくほど過激なコンテンツになります。

safe
sensitive
nsfw
explicit

未成年者に有害なコンテンツを生成しないように、nsfwやexplicitをネガティブプロンプトに書くと良いでしょう。

Animagine XLの各バージョン比較

Animagine XLはバージョンごとに仕様などの違いがあります。

ここでは4.0 や 3.1、3.0を比較したときの相違点について以下3点を解説します。

使える特殊タグの違い
学習した環境の違い
ライセンスの違い

１.使える特殊タグの違い

Animagine XLはバージョンによって使える特殊タグや書き方が異なります。

タグ	4.0	3.1	3.0
品質タグ	・masterpiece ・best quality ・low quality ・worst quality	・masterpiece ・best quality ・great quality ・good quality ・normal quality ・low quality ・worst quality	・masterpiece ・best quality ・great quality ・good quality ・normal quality ・low quality ・worst quality
スコアタグ	・high score ・great score ・good score ・average score ・bad score ・low score	–	–
美的タグ	–	・very aesthetic ・aesthetic ・displeasing ・very displeasing	–
時間タグ（年代タグ）	・year {n}	・newest ・recent ・mid ・early ・oldest	・newest ・late ・mid ・early ・oldest
レーティングタグ	・safe ・sensitive ・nsfw ・explicit	・safe ・sensitive ・nsfw ・explicit, nsfw	・rating: general ・rating: sensitive ・rating: questionable, nsfw ・rating: explicit, nsfw

複数のバージョンを利用するのであれば、スコアタグおよび美的タグの有無や、レーティングタグの書き方などに気を付けてください。

２.学習した環境の違い

3.1以前と4.0では、学習に使用した画像数や時間に大きな違いがあります。

3.1までのバージョンでは100万前後の画像を500GPU時間かけて学習していましたが、4.0では800万を超える画像の学習に2650GPU時間かけています。

GPU時間とは？

GPUの数×学習にかかった時間で算出される時間単位。

5つのGPUを用いて2時間学習した場合、学習時間は10GPU時間となる。

以上から、4.0は以前のバージョンを継承していないものの、学習量で引けを取っていないことがわかるでしょう。

ちなみに、その他の学習環境の比較は以下のとおりです。

比較	4.0	3.1	3.0
ハードウェア（GPU）	7 × H100 80GB SXM5	2 × A100 80G	2 × A100 80G
学習した画像数	8,401,464	873,504	1,271,990
学習時間	約2,650GPU時間	350GPU時間以上	500GPU時間以上
UNet学習率	2.5e-6	1e-5	7.5e-6
テキストエンコーダの学習率	1.25e-6	1e-5	3.75e-6
スケジューラ	ウォームアップ付き定常学習率（Constant with Warmup）	コサインアニーリング・リスタート（Cosine Annealing Warm Restart）	ウォームアップ付き定常学習率（Constant with Warmup）
ウォームアップのステップ	5％	サイクル数: 10、最小 LR: 1e-6、 LR 減衰: 0.9、最初のサイクルステップ: 9,099	100
バッチサイズ	32	16×3×2	48×1×2
オプティマイザ	Adafactor	AdamW	Adafactor

３.ライセンスの違い

4.0はCreativeML Open RAIL++-Mライセンスであるのに対し、3.1と3.0はFair AI Public License 1.0-SD ライセンスの対象となっています。

とはいえ、Fair AI Public License 1.0-SD は Stable Diffusion のライセンスと互換性を持つように設計されているため、CreativeML Open RAIL++-M との大きな違いはありません。

どちらのライセンスも商用利用、改変、配布、個人利用が認められているので、用途別にモデルを使い分ける必要はないでしょう。

ライセンスの禁止事項と要件

CreativeML Open RAIL++-M および Fair AI Public License 1.0-SD のライセンスでは、以下が禁止されているので注意してください。

適用される国内法、連邦法、州法、地方法、または国際法または規制に違反する方法。

未成年者を搾取し、危害を加え、または何らかの方法で搾取もしくは危害を加えようとする目的のため。

他人に危害を加える目的で、検証可能な虚偽の情報やコンテンツを作成または配布すること。

個人に危害を加えるために使用できる個人を特定できる情報を作成または配布すること。

他人を中傷、蔑視、またはその他の方法で嫌がらせすること。

個人の法的権利に悪影響を及ぼしたり、拘束力のある強制可能な義務を生み出したり変更したりする完全に自動化された意思決定のため。

オンラインまたはオフラインでの社会的行動、または既知または予測される個人的または性格的特徴に基づいて個人またはグループを差別したり傷つけたりすることを意図した、またはその効果を有する使用。

特定の集団の人々の年齢、社会的、身体的または精神的特徴に基づく弱点を悪用し、その集団に属する人々の行動を、その人または他の人に身体的または精神的危害を引き起こす、または引き起こす可能性のある方法で著しく歪曲すること。

法的に保護されている特性またはカテゴリーに基づいて個人またはグループを差別することを意図した、またはその効果を有する使用。

医療アドバイスおよび医療結果の解釈を提供するため。

個人が詐欺や犯罪の可能性を予測するなど、司法、法執行、移民または亡命手続きに使用される目的で情報を生成または配布すること（例：テキストプロファイリング、文書内の主張間の因果関係の解明、無差別かつ恣意的に対象を絞った使用など）。
引用元：Fair AI Public License 1.0-SD を翻訳

また、モデルをコピーしたり改変したりする際は、基となったモデルのライセンスを共有する必要があるので要注意です。

変更したモデルをネットワーク上でアクセスできるようにする場合は、ソースコードも提供しなければなりません。

その他の細かい点については原文をチェックしてみてください。

Animagine XLに関するQ&A

Animagine XLに関する、よくある質問と回答を紹介します。

どんなキャラクターや作品が対応していますか？
Animagine XLはどこで使えますか？
ローカル環境（自分のPC）で利用するには？
今後のバージョンアップ予定は？

どんなキャラクターや作品が対応していますか？

以下のリンク先で、Animagine XL 3.1に対応したキャラクターのリストを確認できます。

https://huggingface.co/spaces/cagliostrolab/animagine-xl-3.1/resolve/main/wildcard/characterfull.txt

2025年2月時点では、Animagine XL 4.0のキャラクターリストは公開されていません。

そのため、4.0を利用している場合も3.1のリストを参考にすると良いでしょう。

Animagine XLはどこで使えますか？

Animagine XLは以下の方法で利用できます。

HuggingFaceのスペースにあるデモ版を使う
Civitaiなどで提供されている画像生成サービスを利用する
ローカル環境で環境を構築する
diffusersを利用する

高スペックPCを使って回数制限なく生成したい場合はローカル環境を、準備の手間なく利用したい場合はオンラインの画像生成サービスを、それぞれ利用すると良いでしょう。

公式のモデルカードではdiffusersの使い方が解説されていますが、画像生成するためにコードを記述する必要があるため敷居が高めです。

ローカル環境（自分のPC）で利用するには？

Stable Diffusionを自分のPCで利用するには、以下の手順で環境を整える必要があります。

インストールに必要なアプリを入手する
Stable Diffusionをインストールする
Animagine XLのモデルデータをダウンロードする
ダウンロードしたモデルを指定された場所に置く

詳細な方法については以下の記事で解説しているので参照してください。

meta land

Stable Diffusionの使い方とコツを初心者向けに解説！無料の画像生成AIとは？ | meta land 本記事では、自由度の高い画像生成AIツールであるStable Diffusionについて解説しています。導入方法やプロンプトの入力についてもわかりやすく解説していますので参考にし…

Animagine XL 4.0モデルは、こちらのページで入手することが可能です

OptとZeroの違いは？

OptとZeroは、どちらもAnimagine XL 4.0のモデルです。

モデル	特徴	ダウンロードページ
Opt	追加のデータセットで学習・改良された汎用モデル	https://civitai.com/models/1188071?modelVersionId=1408658
Zero	追加学習前のベースモデル	https://civitai.com/models/1188071?modelVersionId=1409042

通常の画像生成にはOptが向いており、Loraのような追加データのトレーニングにはZeroが適しています。

今後のバージョンアップ予定は？

CagliostroLabのブログで公開されているロードマップによると、今後計画されているプロジェクトの計画は以下のとおりです。

2025 Q1	Animagine-XL v4.0（リリース済み）Animaestro 2B
2025 Q2	Animagine-XL v4.1Animagine-XL v4.1 Flow
2025 Q3	？
2025 Q4	開発にAIを利用したノベルゲーム

次のバージョンとなる4.1は、2025年のQ2（4月～6月）にリリースされるでしょう。