AIだけでサムネは作れるか — ただっちとともみんの実験30分

GPTs LABO MORNING LIVE

AIだけでサムネは作れるか
— デザインとAIのプロがガチで挑んだ実験30分 — GPTs研究会LIVE(9月25日)

2025年9月25日(水)GPTs研究会LIVE

家事と子育てのスキマで経営する3方よしAI共創コンサルタントの田中啓之、ひろくん(@passion_tanaka)です。今回はただっちが語ったAIサムネ実験のLIVEを紹介するね。

デザインのプロとAIのプロが2人で組んで、「AIツールだけでYouTubeサムネイルを完成させられるか」に挑んだのが、GPTs研究会9月25日の回。見終わって最初に思ったのは、「これ、かなり正直なLIVEだな」ってこと。英語になってしまう、人物が別人になる、文字が途中で切れる——サムネ制作のリアルな壁が、編集なしにそのまま映し出されていた。

「プロでも失敗する。それを見てほしい」とただっちが最初に言ったのが、このLIVEのすべてを表してると思う。成功の手順書じゃなくて、試行錯誤の実況中継。AIでサムネを作ってみたい人にも、すでに挑戦していてうまくいかなくて悩んでる人にも、「あ、プロでもこうなるんだ」って安心できる一時間だった。

ホストとゲストの挨拶シーン(オープニング)
🧪 ライブから得た「失敗のデータベース」 - 動画キャプチャ

🎬 LIVE配信アーカイブはこちら!

01

「失敗してもいい」を合言葉にした実験のルール

▶ 動画で見る(0:27〜)

このLIVEが始まってすぐ、ただっちはこう宣言した。「プロでも失敗するんだということを見てほしい」と。ふつうLIVEって、ある程度うまくいく流れで組み立てるものだと思う。手順を見せて、こう使うと便利ですよ、っていう。でもこの日のただっちは違った。完成するかどうかわからないまま、「実験」という言葉を使ってカメラの前に立った。

デザインのプロとAIのプロが並んでいる。ただっちはAIの活用に詳しく、ともみんはデザイナーとしての視点を持つ。2人の組み合わせは最強に見えるかもしれない。でも実際のサムネ作りは、最強のチームを持ってしても、すんなりいかないのだ。それを隠さずに見せる——これが今日の実験のスタンスだった。

🔎 本日の実験概要と狙い(イントロ) - 動画キャプチャ

ただっち(0:27〜)

「デザインとAIのプロのガチが、サムネイルは作れるのかという実験をしていきたいと思いますので皆さん楽しんでいただけたらと思います。もう本当にですね僕らもいろんな実験と失敗を繰り返しながらやっておりますのでぜひぜひプロでも失敗するんだというか失敗してもいいんだというのをぜひ皆さんにご覧いただけたらなと思っております。」

「失敗してもいい」。この一言、すごく刺さった。AIを使い始めた頃って、うまくできないと自分の能力のせいにしがちなんですよね。「自分にはセンスがない」「AIが使いこなせていない」って。でもただっちが言ってるのは違う。プロでも失敗する。それが当たり前なんだ、と。実験と失敗を繰り返しながら——この「繰り返しながら」という言葉が、すごくリアルだと思う。一発でうまくいくことへの期待を外してくれる言葉だから。

実際に、AIで何かを作ろうとするとき、最初から完璧なものができるケースはほとんどない。プロンプトを試して、結果を見て、修正して、また試す。この繰り返しこそがAI活用の実態なのに、「一発で出てくるはずなのに」という誤解を持ってる人は多い。ただっちはその誤解を、実験を通して解いてくれていた。

🖼️ 実際のワークフローとスクリーンショットで振り返る - 動画キャプチャ

ただっち(0:27〜)

「でも途中まで作ったらもうトモミンすいませんお願いしますって言って毎回はしておりますけどもやっぱりデザイナーの視点と視点が違うなと思っているので」

「途中まで作ったらトモミンに頼む」——これ、実はすごく大事な話だと思う。AIで何かを作るとき、どこかで「全部AIがやってくれる」という期待を持ちがちだ。でも実際は、AIが出力したものを「どう仕上げるか」という人間の判断と、専門家の目が必要になる瞬間がある。ただっちはその「ここまでがAI、ここからが人間」という切り替えをちゃんと意識していた。

「デザイナーの視点と視点が違う」という言葉も深い。AIを使う人の目線と、デザインを専門とする人の目線は、同じものを見ていても気づくことが違う。生成された画像に対して、「なんかいい感じ」と思うのと、「フォントウェイトがここだけ浮いてる」と見えるのは、まるで別の解像度だ。その違いを自分でカバーしようとするより、ともみんに任せる——この判断がただっちらしいと感じた。

料理で言うと、AI画像生成は「食材の下ごしらえ」まではできる。でも「この一皿をどう盛り付けて、誰に出すか」という最後の仕上げは、やっぱり人間の感性と経験が入ってくる。ただっちはそのことを、LIVEの最初の30秒でさらっと言ってみせた。実験のルールはシンプルだ。AIツールを使ってサムネイルを作る。うまくいかなかったらどう対処するか。途中で諦めたらそれも含めて見せる。この姿勢があるから、私はこのLIVEを最後まで飽きずに見ていられた。

02

日本語テキストという壁 — 小学校の入学式みたいな英語が入ってきた

▶ 動画で見る(9:49〜)

サムネ制作で最初にぶつかる壁。それが「日本語テキスト」の問題だ。AIに画像を生成させると、日本語のタイトルがちゃんと入るはずが——なぜか英語になってしまったり、文字が途中で切れてしまったり、まったく読めない崩れ方をしたりする。これ、やってみた人は絶対に一度はハマったことがあると思う。

ただっちが作ろうとしていたのは、YouTubeのサムネイルだ。当然タイトル文字を日本語で入れたい。ところが、生成されてくる画像を見ると——英語。しかもただしい英語じゃない。文法も何もかも怪しい、いわゆる「破綻した英語」が入ってきてしまう。この瞬間の、ただっちの表現が絶妙だった。

生成結果に英語テキストが入ってしまった状態

ただっち(9:49〜)

「ほんとだ。なんか、小学校の入学式に行くみたいな。もう英語も破綻しているよね。そうなんですよね。日本語で書いてって言わないと、このタイトルは書いてくれなかったりするんですよね。」

「小学校の入学式みたいな英語」——この表現、すごくリアルだなと思った。入学式の看板に書いてあるような、片言でちょっとズレた英語。AIが一生懸命だしてくれているのはわかるんだけど、見た目としてはどうしてもサマにならない。ただっちがこの一言でそのまま言い表してくれていて、私も思わず「わかる!」ってなった。

じゃあどうすればいいか。答えは実はシンプルだった。「日本語で書いて」と、プロンプトにちゃんと明示する。当たり前に聞こえるかもしれないけど、これをやらないと、AIは「タイトルを入れるなら英語のほうが自然だ」と判断してしまうことがある。人間の感覚とAIの判断のズレ——その一例がここに出ていた。英語が出てきてしまう問題は、日本語指定を忘れたことにある。逆に言えば、指定すれば改善の余地があるということだ。

生成した画像でタイトル文字が切れている表示

ただっちが続けて語ったのが、「プロンプトを読んで学ぶ」という話だった。

ただっち(10:26〜)

「そのプロンプトを見て、こういうふうにプロンプトを書くとAIはわかってくれるなっていうのを学ぶのはおすすめですね。」

これ、地味だけどめちゃくちゃ大事なことを言ってる。AIツールによっては、生成した画像のプロンプトを後から確認できる機能がある。「あ、このサムネはどうやって作ったんだろう」ってプロンプトをのぞいてみると、「日本語で」とか「フォントサイズは大きめで」とか、細かい指示が入っていることがある。そのプロンプトを読み解くことで、「こう書けばAIはこう理解するんだ」という感覚が身につく。

料理で言うと、レシピを読むだけじゃなくて、実際にシェフが書いたメモを見せてもらうようなイメージだ。完成品を見て「どうしてこの味になったのか」を探るより、「どんな指示を出したか」を見るほうがずっと速く学べる。AIのプロンプトも同じで、うまくいってる画像のプロンプトを参照することが、自分のプロンプト力を上げる最短ルートかもしれない。

C-Dreamで文字だけ試したら崩れた例

日本語テキストの問題は、この日の実験で何度も顔を出した。一度うまくいっても、ツールを変えたり設定を変えたりするとまた崩れる。「また英語になってる」「今度は文字が切れた」——そのたびに対処を考える、という繰り返し。でもその繰り返しの中に、AI画像生成の現時点での特性がある。すべてのツールが日本語に対して同じように対応できるわけじゃない。どのツールがどんな言語処理をしているかで、出力がまったく変わってくるのだ。この日の実験が教えてくれたのは、「日本語テキストの品質はツールによって差がある」という、使い込まないとわからないリアルな差だった。

03

ツールを諦める決断 — GensparkからSolanへの切り替え

▶ 動画で見る(12:28〜)

実験が進む中で、ただっちはひとつの判断ポイントに差し掛かった。「このまま続けても、いい結果が出ないかもしれない」という感触だ。試してみたが日本語テキストがうまくいかない、人物の顔が変わってしまう、フォントが崩れる——積み重なる失敗を前に、「では次のツールに行こう」という決断が必要になる。AIサムネ制作で重要なのは実は、「どのツールが一番いいか」より「どこで切り替えるかの判断力」かもしれない、とこのシーンを見ながら感じた。

12分台のあたりで、ただっちはともみんに「お願いします」と声をかけた。途中まで自分で作ったが、「デザイナーの目が必要だ」という判断をして、バトンを渡した瞬間だった。この判断、私は正直すごいと思う。自分が頑張り続けることより、「ここからは専門家に」と切り替えられる判断力。AIを使う上で、これは本当に大切な姿勢だ。「全部自分でやらなきゃ」という思い込みを手放せている人が、結果として一番いいアウトプットを出せる。

女性が男性イケメンになってしまった生成例

ともみんが仕上げに入ると、画面の空気が変わった。ただっちが「ここ、どうしたらいいですか」と聞くのに対して、デザイナーとしての視点から答えが返ってくる。同じ画像を見ていても、気づくことがまるで違う。この「視点の違い」を体験できるのも、このLIVEの大きな価値だった。1人でAIと格闘しているだけでは絶対に見えなかった角度がある。

ともみんが仕上げた最終サムネイル(プロの手で微調整済み)

そして、ただっちが次に向かったのがSolan(ソラン)だった。Genspark(デンスパーク)ではどうしても日本語がうまく入らず、諦めざるを得なかったのだ。

ただっち(14:20〜)

「日本語はね、タイトルの文字は日本語でお願いしますみたいのは入れたりとかしたけど、もうダメだ、もうこれはちょっとデンスパークはちょっと諦めようと思って、ソランに行ったんですね」

「もうダメだ」と言える潔さ。これが実験者としての誠実さだと思う。うまくいかないツールに固執して時間を溶かすより、「このツールはこの用途には向かなかった」と判断して次に行く。ただっちのこの言葉、ビジネスのあらゆる場面でも通じる話だと感じた。何かがうまくいかないとき、粘り続けることが正解じゃない場合がある。「諦める」という選択肢を持っておくことも、実は戦略のひとつだ。

料理で言うと、フライパンで焼こうとしていたけど「この食材はオーブンのほうが合ってる」と気づいて調理器具を変える感じ。使う道具を変えることは、失敗じゃなくて正しい判断だ。Gensparkで日本語がうまくいかなかったという体験があったから、「Solanならどうか」という比較ができる。失敗したから次が見える。

保存したサムネイル候補を画面共有している場面

このシーンで私がいちばん学んだのは、「AIツールの得意と不得意は使ってみないとわからない」という、当たり前のようで忘れがちな事実だ。スペック表を見て「これが良さそう」と選んでも、実際に自分のユースケースに当てはめてみると全然違う結果になることがある。ただっちはその「当てはめる」作業を、ライブ配信の場でやってみせてくれた。視聴者にとっては、30分で複数のツールの実態を見ることができる、かなり贅沢な体験だったと思う。

04

SeaDreamの得意と不得意 — YouTubeとLPで見えた差

▶ 動画で見る(16:17〜)

複数のツールを試し続ける中で、ただっちは「SeaDream(シードリーム)」というツールについて深く語り始めた。日本語テキストの精度、他のツールとの違い、そして何より「どんな場面に向いているか」という実感値が、実験を通じて浮かんできたのだ。このセクションが、私がこのLIVEの中でいちばん情報密度が高いと感じた部分だった。

まず、2人の検証の途中経過について、ただっちが正直に言語化した。

複数モデル(Nano Banana, C-Dream, Camber等)が並ぶ選択画面

ただっち(16:17〜)

「2人の検証、今現時点ですねまだまだ日本語って難しいんでしょうね。シードリームは中華系なんで漢字はもともと強いはずなんですけど、強すぎて中国寄りの漢字になっちゃうっていうのが欠点ですね。」

「中国寄りの漢字になっちゃう」——これ、実際に見た人じゃないと想像しにくい現象だと思う。SeaDreamは中国系のAIツールで、漢字の扱いは元々得意なはずなのに、その「得意」が逆に働いてしまう。日本語の漢字として出力してほしいのに、微妙に中国語っぽい字体になる、あるいは繁体字に近い字形が出てくる。「強すぎて裏目に出る」という現象は、他の分野でもよく起きることだけど、AIにもそれがあるとは面白かった。

そしてただっちは、IdeogramというツールについてもこのLIVEの中で触れていた。日本語テキストを画像に入れるツールとして、SeaDreamとIdeogramを比較する場面があり、それぞれの特性の違いが見えてくる。

Ideogramが比較的読みやすい文字を出した場面

Ideogramが日本語テキストをうまく出力した場面と、SeaDreamで漢字が中国寄りになる場面——この対比が、「どのツールをどんな場面に使うか」という選択眼を育てる上でとても参考になった。一つのツールがすべてに万能なわけじゃない。用途によって使い分けることが大切だ、という話が、実験を通じてリアルに伝わってきた。

ただっち(21:03〜)

「そうだね、学習してるのは得意かなと思って、YouTubeのサムネなんかは結構学習している感じがするのでLPはあんまり学習できてないのかな、SeaDreamに関してですけど。」

「YouTubeサムネは学習している、LPはあまり学習できていない」——SeaDreamに関するこの実感値、すごく具体的だと思う。AIの画像生成モデルは、どんなデータで学習したかによって、得意なビジュアルスタイルが変わる。YouTubeのサムネイルは世界中に大量に存在していて、学習データとして入りやすい。一方でLPのデザインは、様式が多様すぎたり、クローズドな環境に多かったりして、学習データが相対的に少ない可能性がある。

料理で例えると、SeaDreamはYouTubeサムネ料理のレシピをたくさん持っているけど、LP料理のレシピはまだ少ない状態。同じ調理器具でも、慣れている料理とそうでない料理では仕上がりが違う——そういうことだと思う。

モデル更新で変化が起きることを示す場面

この「ツールごとの学習偏り」という視点は、サムネ制作に限らず、AI画像生成を使うすべての人に役立つ話だ。「このツールはこんな画像が得意で、こんな画像は苦手」という実感を持っておくだけで、最初にどのツールを選ぶかの判断が変わってくる。ただっちとともみんがこの実験でやっていたのは、実はそういう「ツールの特性マップを体験的に作っていく」作業でもあったと思う。

05

余白を埋めたくなる性と、失敗してもやってみる話

▶ 動画で見る(23:02〜)

実験の後半に入ると、ただっちの話は「技術」から「感覚」の話へとシフトしていった。何をどのツールで作るかより、「なぜうまくいかないのか」「なぜ悩んでしまうのか」というもっと人間的な部分に踏み込んでいった。ここが私にとって、このLIVEで一番刺さった部分だった。

まず、ただっちはLP制作における「何を伝えるか迷子になる問題」を語り始めた。これ、サムネに限らず、広告やLP、SNS投稿を作ったことがある人なら絶対に共感できる話だと思う。

自動プロンプトで生成中の進捗表示

ただっち(23:02〜)

「そうですね、LP講座の受講生さんも、やっぱ作ってみるんだけども納得いかないとか、何を伝えればいいかのがちょっとぼんやりしちゃってる方とか、いろいろ伝えたくなりすぎちゃって、結局何伝えたらいいんだかわかんないっていうのはあるあるですね。」

「いろいろ伝えたくなりすぎちゃって、結局何伝えたらいいんだかわかんない」——これ、まったくその通りだと思う。作り手になると、伝えたいことが山ほど出てくる。あれも入れたい、これも入れたい。でもそれを全部入れようとすると、受け取る側には何も刺さらなくなる。絞ることへの恐怖と、絞ることへの必要性が同時に存在するジレンマ。ただっちのLP受講生さんの話は、実はサムネイル作りにもそのままつながってくる。

サムネイル候補を保存している場面(画面共有)

そしてただっちは、自分自身の「失敗談」を語り始めた。余白を見ると埋めたくなってしまうという、作り手特有の衝動について。

ただっち(23:40〜)

「そうなんですよね。空白があったら埋めたくなる欲求、この作り手として。そう、なんかね、余白が気になってね、埋めたくなっちゃったんですよ。僕の失敗というかね話よもう迷子になります迷子になってトモミンにお願いしてめちゃくちゃいいなと思って。僕も悩みながら皆さん作ってますので安心してください。」

「余白が気になって埋めたくなっちゃった」——これ、めちゃくちゃわかる話だ。デザインって、余白が息をするスペースなのに、作り手の目線だと「何もないところが不安」に見えてしまう。情報を詰めれば詰めるほど、見る人には何も残らなくなる。でもそれがわかっていても、ついやってしまう。ただっちが「僕の失敗」と言って、それを隠さず話してくれているのが、このLIVEの正直さの核心だと思う。

Ai-chanの元写真をベースに脳内プロファイルで生成した複数のビジュアル

「迷子になってトモミンにお願いして、めちゃくちゃいいなと思って」——ここが好きだった。迷子になることは恥じゃない。迷子になって、でもそこで止まらずに「助けを借りる」という次の一手を打てること。それが大事なんだという話に聞こえた。そして最後、ただっちが語ったLIVE全体のまとめともいえる一言が、とても力強かった。

ただっち(33:00〜)

「いかに挑戦して遊んで失敗してでダメだったら諦めて自力でもやるっていうところがポイントかなとは思ってます。でもこの01僕の場合は01が特に苦手なので01のアイデアをもらうのはもうめちゃくちゃいいなと思ってますのでぜひ皆さまAIですね活用いただけたらと思います。」

「挑戦して、遊んで、失敗して、ダメだったら諦めて、自力でもやる」——このサイクルが、AIとの正しい付き合い方だと思う。どれか一つだけじゃない。全部やる。そのうえで、「0→1が特に苦手だから、アイデア出しにAIを使う」という自分の弱点の把握と活用法のセットが、ただっちの言葉の中にある。弱点をわかっているから、AIをどこで使えばいいかが見える。自分を知ることと、AIを使いこなすことは、つながっているのだと感じた。

GALLERY — 実験中に生成されたサムネ候補

💡 AIだけで“完璧な”サムネを作るのは現状こうだ!(結論) - 動画キャプチャ
🛠️ 実務で使うための具体的ワークフロー(ステップバイステップ) - 動画キャプチャ
🎯 AIツール別オススメ活用法(ツールの得意/不得意) - 動画キャプチャ
📸 最大限のキャプチャと使い方(実務での保存・共有のコツ) - 動画キャプチャ
📈 事業に落とし込むための実践アクション(私の提案) - 動画キャプチャ
🔚 最後に(私からの応援メッセージ) - 動画キャプチャ
C-Dream文字崩壊の別ショット

COLUMN

「失敗してもいい」を、私も言いたい

🤝 AIと人間の関係を設計する「3つのルール」 - 動画キャプチャ

ただっちのLIVEを見て、一番残ったのは技術の話じゃなかった。「失敗してもいい」という言葉だ。

私も日々、AIを使って何かを作る。記事を書いて、分身AIの仕組みを整えて、コンテンツを生み出そうとする。で、うまくいかないことが、当然ある。プロンプトを直して、また試して、「あれ、なんで?」って首をひねる時間が結構ある。そういうとき、「私がうまくできないのかな」って思いかけることがある。

でもただっちが見せてくれたのは、プロでも同じだってこと。試して、ダメで、切り替えて、また試す。その繰り返しそのものが、学習なのだ。

料理に例えると、新しいレシピを初めて作るとき、一発で完璧に仕上がることなんてほとんどない。味を見て、足りないものを加えて、また味見する。AIを使うのもまったく同じで、「一発でできないこと」は前提なのだ。その前提を受け入れられるかどうかが、続けられるかどうかの分岐点になってくる。

「0→1のアイデアをもらうのがAIの使いどころ」というただっちの言葉も、自分の経験に照らしてすごく腑に落ちた。まっさらな状態から何かを始めるのは、誰にとっても一番エネルギーがいる。そこをAIに手伝ってもらって、人間は「それをどう育てるか」「どう磨くか」に集中する。そのやり方、私も分身AI.comを通じてずっとやってきたことと同じだと気づいた。

失敗を見せてくれるLIVEって、実は最強のコンテンツだと思う。うまくいく手順より、うまくいかない過程のほうが、見てる人に残るものが多い。それをただっちは30分間でやり切った。

FAQ

よくある質問

Q. AIだけでYouTubeサムネイルを完成させることはできますか?

このLIVEでは、「途中まで作ったらともみんに頼む」という分業スタイルが答えでした。AIが0→1のアイデアや下地を作り、デザイナーが仕上げる。AI単独で完璧に完成させるより、どこで人の目を借りるかを決めておくことが、結果として質の高いサムネになる近道だとただっちが話しています。

Q. AI画像生成で日本語テキストを正しく出すコツは?

ただっちの言葉を借りると、「日本語で書いてって言わないと、このタイトルは書いてくれなかったりする」とのこと。プロンプトに「日本語で」と明示することが基本です。また、うまくいっているサムネのプロンプトを見て学ぶことも、AIへの指示の書き方を習得する早道だと語っていました。

Q. SeaDreamはYouTubeサムネとLPサムネ、どちらが得意ですか?

ただっちは「YouTubeのサムネなんかは結構学習している感じがする。LPはあんまり学習できてないのかな、SeaDreamに関しては」と話しています。学習データの多さの違いが出力品質に影響しており、SeaDreamはYouTubeサムネのほうが向いているという実感値が語られました。

Q. SeaDreamで漢字が中国語っぽくなるのはなぜですか?

ただっちは「シードリームは中華系なんで漢字はもともと強いはずなんですけど、強すぎて中国寄りの漢字になっちゃうっていうのが欠点」と語っています。開発元が中国系のため漢字の処理能力は高いものの、日本語の字体より中国語寄りのフォントや字形が出やすい傾向があるとのことです。

Q. AI画像生成でサムネを作るとき、途中で諦めても大丈夫ですか?

大丈夫です。ただっちは「ダメだったら諦めて自力でもやる」と言っています。このLIVEでもGensparkでうまくいかないと判断したらSolanに切り替える、という判断を実際にやってみせていました。どこでツールを変えるかを判断することも、AI活用の重要なスキルのひとつです。

LIVE REPORT

「AIに毎回お願いする」を卒業|grill-meで尋問、Goalで自走する仕組み

AIへの依頼を仕組み化して、毎回指示しなくてもいい状態をどう作るか。

LIVE REPORT

AIは「使う」から「任せる」へ|今週の生成AIニュースを専門家5人が総まとめ

AIを「使う」から「任せる」へシフトするための視点を専門家5人が語る。

LIVE REPORT

Codex新機能Record & Replayとは|作業を見せて覚えさせるAI

AIに「やって見せる」だけで仕事を覚えさせる、Codexの新機能を解説。

LINE OPEN CHAT

Claude Code・AIエージェント実践会

2000人突破! インストールから自動化まで、仲間と一緒に実践しよう

LINEオープンチャットに参加する(無料)

パスコード: 1111

🤖 AI生成コンテンツについて

この記事はAIツール(Claude Code)を活用して制作しています。構成・文章生成・画像制作にAIを使用し、最終的な内容の確認・編集・公開判断はひろくん(田中啓之)本人が行っています。「分身AIひろくん」(bunshin-ai.com)とは別のコンテンツです。

上部へスクロール