AIでイラストを生成する際、プロンプトがどう作られているかが結果に大きく影響します。今回は、プロンプトの作成方法について、単語と文章の2パターンを比較してみましょう。
※ツールはbing image creator(copilt designer)を使用
この記事の対象者
- プロンプトの作成方法がわからない
- プロンプトの構成に悩んでいる
- プロンプトの精度と詳細度に自信がない
- 日本語と英語のプロンプトの効果に疑問がある
この記事で学べること
- AIイラストを生成するプロンプトの基本的な作り方
- 単語構成と文章構成のプロンプトの違い
- 日本語と英語のプロンプトを使い分けるメリット・デメリット
- 【オマケ】現役のAIクリエイターのプロンプトの作り方
- 【オマケ】Grokを使った生成クオリティ
以下より、本編です。
基本的なプロンプト作成方法
単語の連携
単語を組み合わせてプロンプトを作る方法です。
例文「Apple、Red、White plate」(白いお皿に乗ったリンゴ)で生成します。
※実際に生成した画像です。リンゴとお皿以外はAIによるデザイン
- シンプル:短いフレーズで直感的にイメージを伝わる
- 柔軟:単語の組み合わせで色んなバリエーションが可能
- 予測しやすい:解釈が簡単で一定の結果が得られやすい
利点:
- 迅速:短いプロンプトで速く生成
- 直感的:シンプルで分かりやすい
短所:
- 限定的:詳細な指示ができず、結果が曖昧になることがある
ヒント:シンプルな生成に適していますが、実は役割を区分してプロンプトを作ると単語連携でも詳細に作れます
文章による生成
文章で具体的な指示を出す方法です。
例文「A red apple on a white plate」で生成します。
※実際に生成した画像です。リンゴとお皿以外はAIによるデザイン
- 具体的:詳細な説明ができ、精緻な結果が得られる
- 文脈を提供:イメージを具体的に指示
- 意図が明確:生成するモノの意図がはっきりする
利点:
- 詳細な指示:複雑な要求にも対応
- カスタマイズ:特性を細かく調整
短所:
- 複雑さ:プロンプトが長くなり、予測が難しくなることがある
- 時間がかかる:詳細な説明が必要で生成が遅くなることがある
ヒント:作る前からイメージ像があり、それを詳細に生成したい場合に使用すると効果が大きいです
単語プロンプトと文章プロンプトの比較から導き出される要点
ここが大事なポイントです。
ブックマークやスクショしておくと、困ったときの判断材料になりますのでご活用ください。
- 単語プロンプト:簡単で速い。シンプルなイメージに最適。
- 文章プロンプト:詳細で具体的。複雑なイメージに向いている。
- 精度と効率:単語プロンプトは予測しやすく迅速。文章プロンプトは精度が高いが手間がかかる。
- ニュアンス:単語プロンプトは基本的なイメージ、文章プロンプトは細かなニュアンスを伝えやすい。
ヒント:プロンプトに明示されていない部分はAIが勝手に作ってくれます。詳細な説明が多いほどAIが勝手に描くスペースが減り、自分のイメージに近づきます!
超わかりやすく詳細な説明が欲しい方はこのお手本記事がおすすめです
多言語プロンプトの比較
すでにAIツールを使っている方に質問です。
「なぜAIツールの日本語実装がなされたのでしょうか?」
きっと、「日本人が使いやすくするため。」と多くの方が答えると思います。
次章より、それ以外の答えを解説していますので、じっくりご覧ください。
ほとんどのユーザーが知らないココだけの解説です!
日本語と英語の併用
日本語文章と英語文章のプロンプトを使う方法です。
例文「書道を習っている男の子」+「A boy learning calligraphy」
- 多言語対応:二つの言語で指示を出すことで、より明確な指示になる
- ニュアンス確認:日本語から英語に翻訳することで、翻訳の精度や意味の変化を確認できる
- 精度向上:二重のプロンプトで精度が高まる可能性あり
利点:
- 意図の明確化:具体的な指示が可能
- 結果の比較:言語間で生成結果の違いをチェックできる
短所:
- プロンプトが複雑:管理が少し面倒になることがある
- 翻訳のズレ:AI学習されていないものは翻訳のズレが発生する
ヒント:日本語と英語でのアプローチをすることで、日本文化についての生成が狙いやすくなります!
英語プロンプトのみ
英語プロンプトのみでイラストを作ります。
例文「A boy learning calligraphy」
- シンプル:単一の言語で指示が簡潔
- 一貫性:言語の一貫性が保たれ、英語での解釈のズレが少なくなる
利点:
- 簡潔:管理が簡単
- 安定:一貫した結果が得やすい
短所:
- ニュアンスの欠如:日本語のニュアンスが反映されにくい
- 翻訳の問題:日本語の細かなニュアンスが失われることがある
ヒント:AI学習が進んでいるツールならば英語のみのプロンプト精度が一番クオリティが高いです!
多言語プロンプトの比較から導き出される要点
この記事の本懐部分になります。
日本文化を加えたイラストを生成する際は日本語と英語の併用をおすすめします。
日本語と英語の併用プロンプト
- 精度が上がる:日本語と英語の両方で指示すると、より正確な生成が可能
- 手間が増える: 管理が複雑になることがある
英語のみのプロンプト
- シンプル: 単一言語で管理が簡単
- ニュアンスが失われることがある: 日本語の細かいニュアンスが反映されにくい
まとめと【オマケ】のプロンプト説明とGrok生成
さいごまでご覧いただいたあなたに、実際に使用しているしまじろうのプロンプトを1つご紹介します。
日本語と英語の両方でアプローチしたプロンプトの作り方
構成は【日本語プロンプト+単語連携】です。
※前提条件として日本語が使えるAIツール(bingやChatGPT)が対象
まず生成した画像がコチラ(幾分の破綻はご愛敬で)
プロンプト原案と使用したプロンプト
【プロンプトの原案】
タイトル:手持ち花火をしている女性と空に打ちあがった花火
イラストスタイル: 2Dセル画
ブラシスタイル:ネームペン
ベースカラー:多色
カメラアングル:ワームアイショット
中心人物:日本の女の子(30%)
髪色:シルバー
髪型:ロングの三つ編み2つ
目色:微光のブルー
目形:卵型
化粧:ガーリーピンク
表情:敬愛的な
服装:白いTシャツとブルーデニムのオーバーオール
小物:手持ち花火
動作:横向きでしゃがんで、視聴者に背を向けている
背景スタイル:8K、写真
背景:空に大きな花火が多色に煌めいている
照明:スポットライト
【実際に使用したプロンプト】
Title: 手持ち花火をしている女性と空に打ちあがった花火
Illustration style: 2D cel
Brush style: Name pen
Base color: Multicolor
Camera angle: Warm eye shot
Main character: Japanese girl (30%)
Hair color: Silver
Hairstyle: Two long braids
Eye color: Faint blue
Eye shape: Oval
Makeup: Girly pink
Expression: Adoring
Clothing: White T-shirt and blue denim overalls
Accessories: Hand-held fireworks
Action: Crouched down sideways, with her back to the viewer
Background style: 8K, photo
Background: Large fireworks sparkling in multiple colors in the evening sky
Lighting: Spotlight
最初に各項目を設定してあげると単語を連携して詳細なイラストが生成できます。背景は写真指定すると写真にはなりませんが描写が細かくなりやすいです。細かい設定は下記の記事をご覧ください!
髪型にこだわりたい方は
イラストで伝えたいことが人物または背景で構成を変える方法
描く線(ブラシ)にこだわる全108種類のブラシリスト
最後にXのGrokでもAIイラスト生成を試してみました
Grokによって生成されたプロンプトの和訳
私は、「銀色の髪を2本の長い三つ編みにし、淡い青色の楕円形の目をした日本人の女の子が、白いTシャツと青いデニムのオーバーオールを着て花火を持ち、左端の視聴者に背を向けて横向きにしゃがみ、空に大きな花火が打ち上げられ、マルチカラーで、暖かい目線で撮影され、8K写真品質の背景で、スポットライトが当たっている2Dセルアニメーション」というプロンプトで画像を生成しました。
細かな設定反映は難しいですが、割ときれいに生成されていると思います。ほかにも動物関連での写真生成しましたが兼ね良いクオリティでした。
さいごまでお読みいただきありがとうございました。AIイラスト生成のプロンプト作成には、単語の連携、文章、そして多言語プロンプトの使い方があります。それぞれの手法には特徴と利点があり、シチュエーションによって使い分けることが大切です。目的に合わせて最適なプロンプト構成を選んで、より良い結果をお楽しみください。
コメント