AIは指示通りに動くのか?理想の画像を生成するまでの全記録
2023年6月から受講開始させていただいた「仕事の自給講座」が、本日ついに卒業の日を迎えました。
ゆうきさん主催のこの講座で、AIツールを使ってお礼のメッセージを作成する試行錯誤を繰り返しました。
これなら、理想のイメージをサクッと作ってくれるだろう!と、期待に胸を膨らませていたのですが、現実はそう甘くはありませんでした。
私の指示に対し、AIは時に予想外の解釈をし、時に全く別人を生み出し、時には本の数が変わってしまう、というまるでAIと格闘しているかのような日々(笑)。
何とか形になったので講座生の画像生成AIを使ってみたい方、あるいはAIとの付き合い方に悩んでいる方、皆さんの創作意欲のヒントになればと、ありのままの経緯を記事にまとめました。
ぜひ最後までご覧ください!
形にしたかったこと
ゆうきさんを囲む受講生さんのイメージを画像にしたいなと思ったのが発端でした。
まずはWhiskでやってみた
Google Labsが提供する画像生成AIツールです。
テキストプロンプトを入れなくても、画像をアップロードするだけで被写体、シーン、スタイルを自動分析し、新しいビジュアルを直感的に作成できます。
Whiskの最初の画面はこんな感じです。
最初は軽い気持ちで始めました。

1回目のプロンプト
水彩画イラスト、モデル、背景、スタイルの画像を一枚の画像にしてください、その周囲に30代の日本人の男女20人が笑顔で取り囲んでいる画像を作ってください

2回目のプロンプト
水彩画イラスト、モデル、背景、スタイルの画像をそのまま一枚の画像にしてください、その周囲に30代の日本人の男女20人が笑顔で取り囲んでいる画像を作ってください

最終形プロンプト
いろいろPerplexityにWhisk用のプロンプトの文章をやり取りし、何回か繰り返しました。
この画像の眼鏡をかけた40代男性の顔、緑のTシャツの服装、体格、笑顔の表情を完全に同じ人物として保持。木造の暖かい部屋の背景(木目棚、本棚、柔らかいオレンジ照明、自然光)を正確に維持し、リアルな写真スタイルを保つ。男性が床や低いテーブルに座ったポーズで、左手と右手それぞれに分厚い本を2冊ずつ合計4冊をしっかり抱え・支える自然な動作に変更。本の表紙は緑基調で「自給自足でセミリタイヤ」などの日本語タイトルが入ったデザインをリアルに描き、積み重なった本の質感を強調。カメラは斜め正面のアングルで上半身中心、親しみやすい日常写真風。男性の顔と緑Tシャツを元の画像と完全に一致させて。本は4冊すべて日本語タイトルを明確に。
少しは、似せて作れたかなという結果になりました。
人物は違いますが、本の表紙の再現性は最初よりずっと高まった感じに変化しました。
やっぱりプロンプトだなぁと作りながら学ぶところが多かったです。


Geminiでやってみた
同様にGemini(Nano banana)で挑戦です。

すごいビックリな再現率です。
畑の中で本を持たせてみました。

全然違う本を抱えてます。
そこで一冊ずつ、持たせてみることにしました。
まずは手元から本を消します。

一冊持たせてみます。

うまくいったので、もう一冊持たせてみます。

同じ本を持ってしまいました。
そこで違う本を持たせます。

そうしたらうまくいきました。
3冊目は同じような本と認識してしまうのか何度やってもうまくいきませんでした。

ゆうきさん勝手に写真使ってすみません。
でも、チャレンジしてよかったです。学びがありました。
温かな感謝の気持ち
ゆうきさん、長い道のりを一緒に歩んでくれて、心からありがとうございました。
講座生一人ひとりの成長が、輝いていました。
AIの力を借りて生まれたお礼は、温かさを大切に。
皆さんのこれからが、もっと自給自足の喜びに満ちますようにと想いを込めました。
今後とも変わらぬお付き合いをよろしくお願いします。










