【AIコンテンツ革命!スマホ一台で“感動”を生み出す画像&音楽制作時代へ】 GPTs研究会LIVE|9月26日 レポート

こんにちは、ひろくんです。私、田中啓之は「3方よしAI共創コンサルタント兼おうちCEO」として、日々AIを使った仕組み作りやクリエイティブの共創支援をしています。今回はAI氣道チャンネルで配信された「AIコンテンツ革命!スマホ一台で“感動”を生み出す画像&音楽制作時代へ」というライブ配信(9月26日)をベースに、スマホだけで感動レベルの画像と音楽を生み出す方法を、実演とともにわかりやすく深掘りしていきますよね。

目次

🔍 はじめに:今回のライブで扱ったことと私の視点

今回のライブでは主に二つのツールが紹介されました。ひとつは画像編集・生成の新機能「Photogenius(フォトジーニアス)」を搭載したGenspark(ジェンスパーク)、もうひとつは音楽生成AIの大進化版「Suno(旧名:Snow)ver.5」です。登壇者はAI開花マーケターのただっちさんと、AIカイテキサポーターの友くん(Tomokun)・私とは別の「ひろくん」表現とは別ですが、ここでは発表者名を識別して解説します。

私の立場から言うと、AIは“仕組みを作るための道具”であると同時に、“個人のクリエイティビティを爆発的に広げる触媒”です。今回紹介された機能群はまさにその象徴で、特にスマホだけでここまで行けるのは、本当に時代が変わったなと感じますよね。

🎯 本記事の狙いと読み方

この記事では、ライブ配信の内容を元に次のことを目指します。

  • GensparkのPhotogeniusをスマホでどう使うかの具体的手順(初心者でもできる)
  • Suno ver.5を使ったスマホでの音楽生成の実演ポイントとコツ
  • 実際に作ってみた際の注意点(著作権、商用利用、品質の選び方)
  • 私、ひろくん的「AIクリエイティブの活用哲学」と実践プラン

各セクションに対応する動画のタイムスタンプを示したスクリーンショット(キャプチャ)を挟みつつ、スマホだけで完結する手順を具体的に示します。キャプチャはタイムスタンプ付きで多めに入れているので、動画を見返すときにも便利だと思いますよ。

📸 セクション1:Genspark(ジェンスパーク)とPhotogeniusの全体像

まずはGensparkのPhotogenius機能の紹介パートから。ライブで友くんが実演してくれたとおり、この機能はスマホアプリ上で音声入力を使って「どんな編集をしたいか」を指示するだけで、写真の大幅なリタッチやスタイリング変更、背景置換、表情の修正などを自動で行ってくれます(動画タイムスタンプ 24:59~29:37)。

Photogeniusのスマホ初期画面(アップロードボタンが見える)

(動画タイムスタンプ:24:59)この画面で「Upload image」をタップして元写真をアップロードします。友くんは朝に撮ったラフな自撮りをアップして、いくつかのテンプレートで試していました。テンプレートがあるのがポイントで、プロンプトをゼロから打つ必要がないから敷居が低いんだよね。

音声による指示を受け付けるPhotogeniusの対話UI

(動画タイムスタンプ:25:17)音声に対して「スーツにして」「秋らしい雰囲気に」と話しかけるだけで衣装変更やトーン調整が行われます。ここが最大の強みで、AIの苦手な「説明する手間」を劇的に短縮しているですよね。

Photogeniusの主な機能(まとめ)

  • 音声で指示→テンプレート適用(顔の修正・表情変更・背景変更)
  • 「美肌」「表情を笑顔に」「体型補正(腕・ウエスト・脚)」などのボタン操作
  • エフェクトやライティングの調整(強度やトーンの微調整可能)
  • スマホ専用機能として非常に軽快、短時間で大量に試せる

実演では「美肌」モードをオンにしたら、元の顔が大きく変わって“もはや別人”みたいになっちゃう場面もありました(動画タイムスタンプ 26:41~27:10)。この点は弄りすぎ注意で、”本人っぽさ”を残すか“夢の自分”を作るかは目的に応じて調整が必要だね。

美肌モード適用後の比較:原画がかなり変わる様子

(動画タイムスタンプ:26:49)美肌・表情・体型補正などを組み合わせると、短時間でSNS映えする写真が作れます。ただし、本人確認や実物との乖離による問題も起きやすいので、用途を分けるのが吉です。

🎵 セクション2:Suno(旧Snow)ver.5 — 音楽生成AIの凄み

ここはライブで私が最もワクワクした部分です。Sunoの音楽生成はすでにかなり完成度が高く、ver.5では「歌の表現力」「声質」や「スタジオで録音したような音の立ち上がり」が一段とアップしていました。友くんが示した比較はまさにその差の分かりやすい例で、同じ歌詞を使って4.5と5を比較したところ、5の方が明確に“スタジオっぽい”音になっていました(動画タイムスタンプ 11:26~13:30)。

Suno ver.4.5とver.5の音声比較を再生する場面

(動画タイムスタンプ:11:26)ここで友くんは元の日本語曲を英語カバーに翻訳して、Sunoで英語版を生成していました。4.5と5の音質差は一聴瞭然で、5のほうが自然なリズムと声のニュアンスが出てましたよね。

Suno ver.5の注目ポイント

  • 歌声の自然さが増し、スタジオ録音に近いクオリティ
  • 歌詞を入れるだけで英語・日本語など多言語対応のカバーが可能
  • プロンプトは「カスタム」と「シンプル」の二択。シンプルでも十分高品質
  • 有料プランでは編集機能(曲の長さ変更、エフェクト追加など)も利用可能

実際のワークフローはシンプルで、以下のような流れでした。

  1. 歌詞を準備(GPTなどで英訳や作詞補助を行うのがおすすめ)
  2. SunoのアプリやWebに歌詞と曲のスタイルを入力
  3. 「生成」ボタンを押すと数十秒〜数分で完成(バリエーションを複数作ると良い)
  4. 生成後、必要なら編集で微調整(カット、音量、エフェクト)

Sunoで生成した英語カバー(ver.5)の再生時の様子

(動画タイムスタンプ:12:44)友くんが「これはスタジオで録ったみたいだ」と感嘆していたのが印象的でした。私も自分のプロジェクト用に試したら、短時間でデモ曲が作れて驚きましたよ。

⚠️ セクション3:実演で出てきた重要な注意点(商用利用とバージョン差)

ここは現場で何度も出てきたポイントです。ツールの無料版と有料版で機能差があり、特に商用利用やエクスポートに関しては制限がある場合があるので要注意です(動画タイムスタンプ 16:13~17:02、16:28~16:42)。

  • PhotogeniusやSunoなどの無料プランは「個人利用に十分だが商用利用は制限がある」場合が多い
  • Sunoの無料は3.5/4.5が動いていることがあり、最新ver.5は有料または限定アクセスのことがある
  • Generated contentの著作権・権利処理は各サービスの利用規約を要確認

無料版と有料版の差について説明しているスライド

(動画タイムスタンプ:16:13)友くんが示したとおり、無料版でも十分な感動を得られますが、プロ用途や配信・販売を見据える場合は有料版の検討が必要です。とくにSunoの商用利用ルールは要確認で、別途ライセンスが必要になることもありますね。

🛠 セクション4:スマホだけで“感動”を作る具体的手順(ステップバイステップ)

ここは私が最も実務的に役立つように整理したパートです。スマホ一台で画像と音楽を作ってSNSや動画に使うための「最短ワークフロー」を示します。実際にライブでやっていたのとほぼ同等の流れですよ。

画像(Photogenius)制作の手順

  1. Gensparkアプリをスマホにインストールしてログインする(アップデートが必要な場合はUpdateを押す) — 動画タイムスタンプ 28:26~28:46
  2. Photogenius機能を起動し、元写真をアップロード(Upload image) — タイムスタンプ 25:07~25:17
  3. テンプレートを選ぶ(屋外、ポートレート、パリ風など) — タイムスタンプ 22:56~23:09
  4. 音声で「秋っぽく」「笑顔にして」など指示する。不要ならテキストプロンプトで指定 — 24:59~26:08
  5. 自動生成後、スライダーで修正(美肌の強度、ライト、体型など) — 27:10~27:34
  6. 満足できたら保存・エクスポート(SNS用の解像度を選ぶ)

テンプレート選択でパリ風の屋外シーンに変えた例

(動画タイムスタンプ:22:56)テンプレートは初心者の強い味方で、写真の「雰囲気」を一撃で変えてくれるのが最高だよね。

音楽(Suno ver.5)制作の手順

  1. 歌詞を用意。英語にするか日本語のままにするかを決める。GPT系で翻訳やリライトをするのがおすすめ — 動画タイムスタンプ 11:34~12:09
  2. Sunoのアプリ/ブラウザで「新規作成」→歌詞とジャンル(例:mellow, pop)を入力 — 14:22~14:45
  3. 「シンプル」モードでまず複数パターン生成。良いものを選んで「カスタム」で詰める — 14:29~14:43
  4. 生成後、必要ならSnow Studioや他の編集ツールで微調整(ボーカル分離・エフェクト追加) — 17:21~17:56
  5. 完成したらMP3/ WAVでエクスポートして動画編集に組み込む

Sunoで生成したサウンドの試聴風景

(動画タイムスタンプ:12:46)ここで友くんは4.5と5の差を聴き比べていました。まずは無料で試して、違いが出るなら有料にステップアップするのが賢い使い方です。

💡 セクション5:現場で役立つ“ひろくん流”実践テクニック

ここからは私、ひろくんが実際にやっている現場のテクニックをシェアします。AIクリエイティブは「作る」だけでなく「見せ方」が命ですよね。以下のテクニックは、短時間で品質を上げるための裏ワザ的ノウハウです。

1) まずは「目的」を決める(マーケティング目線)

画像や音楽をただ作るのではなく、「誰に、どの場面で、何を伝えたいか」を最初に決めます。私の経験上、目的があいまいだと良い作品にはなりにくいです。例えば「InstagramのA/B投稿でエンゲージメントを上げたい」「YouTubeのショートで視聴完了率を上げたい」など。

2) テンプレートを基準に量産 → 良いものを選別する

Photogeniusのテンプレート、Sunoのシンプル生成は量産に向いています。ここで50パターンくらい作って、その中から「これはいい」と思えるものを磨く。PDCAは良いけど、AI時代はPDCAを待たずに「作って検証」するスピード感が大事です(ライブでも同じメッセージが出ていました。動画タイムスタンプ 31:30~31:58)。

3) 出力後の“人の手”での微調整が最終決め手

AIの生成結果に対して人のセンスで微調整(微妙な表情、歌詞の言い回し、イントロの長さ等)を加えると、プロっぽさが出ます。Sunoで生成した歌声を一度オーディオ編集ソフトで波形編集し、呼吸感やフェードを入れるだけで一段と自然になります。

4) 分離技術を活用して再構築する

Snow Studioの様なボーカル分離・マスタリング技術が進化しているので、既存の素材を分解して再利用することも有効です(動画タイムスタンプ 17:21~17:56)。「ボーカルを取り出して別のアレンジに載せ替える」など、創造の幅がめちゃくちゃ広がるんだよね。

📚 セクション6:よくある質問(FAQ)

Q1:無料版でどこまでできる?

A:無料版でもかなり遊べます。GensparkのPhotogeniusは100クレジット/日などの配布があり、2~3回試せば感覚が掴めます(ライブ内でも100クレジットの話がありました。動画タイムスタンプ 29:47~30:00)。ただし最新モデル(例:Suno ver.5)や高度な編集機能は有料プラン限定のことが多いので、商用利用や本気運用なら有料検討が必要です。

Q2:AIで作った音楽や画像の権利はどうなる?

A:各サービスの利用規約に従う必要があります。ライブでも「商用利用と利用規約の注意」が指摘されていました(動画タイムスタンプ 16:28~16:32)。商用利用や配信・販売を考える場合は、必ずサービスのライセンス条件を確認して、必要ならライセンスを取得してください。

Q3:スマホだけでプロ品質は本当に出るの?

A:短時間で「見栄えの良い」「聞きやすい」作品は十分作れます。特にSNS向けやデモ音源、BGM、短尺動画の音楽ならスマホだけで実用レベル。Suno ver.5の進化で歌モノもかなり自然になってきたから、まずは試してみるべきですよね。

Q4:生成したコンテンツをブログや動画でどう活用すれば良い?

A:実際の活用方法は多岐にわたります。例えば:

  • 商品紹介用のサムネイル写真や人物像の演出(Photogenius)
  • YouTubeショートやInstagramリールのBGMやテーマ曲(Suno)
  • ウェビナーやセミナーでのオープニング曲・テーマソング(短時間でオリジナル作成)

私の場合はこれらを組み合わせ、自社の広告クリエイティブやSNS運用で効果検証を繰り返しています。

📸 キャプチャ集(タイムスタンプ付き) — 実際の操作画面とポイント解説

ここではできるだけ多くのキャプチャを並べ、対応する動画タイムスタンプと解説を入れます。動画を見返す際の目印にしてくださいね。

PhotogeniusのUpload imageボタンが表示されたスマホ画面

タイムスタンプ:24:59 — まずはここから。写真アップロードの入口です。ライブでもここから始めていました。

音声入力に対してAIが返答しているPhotogeniusの対話画面

タイムスタンプ:25:17 — 「スーツにして」「秋っぽく」など音声で伝えるとテンプレートが適用されます。入力のハードルが低いのがポイント。

美肌モードをONにして変化した顔の比較画面

タイムスタンプ:26:49 — 強度を上げると元写真とかなり変わるので利用シーンによって調整を。

テンプレートでパリ風背景に変更された写真の例

タイムスタンプ:22:56 — テンプレート一発で“旅気分”を演出できます。SNS投稿の演出に便利。

Gensparkアプリのアップデート完了後にPhotogeniusが現れる画面

タイムスタンプ:28:26 — アプリアップデート後に機能が追加されるケースが多いです。常に最新版をチェックしましょう。

Sunoの音声比較画面:4.5と5の比較を行っている場面

タイムスタンプ:11:26 — 音の違いを耳で確かめるのが一番。まずは無料で聴き比べてみてくださいね。

Suno ver.5で生成した歌声の試聴中の画面

タイムスタンプ:12:46 — 生成は早いです。良いものは即採用、ダメなら別パターンを出す。気軽にリトライがコツ。

Snow Studioのボーカル抽出や楽器分離の説明スライド

タイムスタンプ:17:21 — ボーカル抽出や楽器分離が可能になれば、既存楽曲のリメイクや再編がしやすいです。

AI活用はPDCAを待たずにとにかく試せ、というメッセージが表示されたスライド

タイムスタンプ:31:30 — ライブでも強調されていたポイント。AIは「まずやってみる」ことが学習とスピードの鍵ですよね。

🚀 セクション7:私(ひろくん)の総括と活用プラン提案

ここまで読んでくれたあなたは既に十分な知識を持っています。最後に私の実務的な提案をお届けします。短期(1週間)〜中期(3ヶ月)〜長期(1年)で、どうAIクリエイティブを事業に落とし込むかのロードマップですよ。

1週間チャレンジ(まずは触る)

  1. GensparkとSunoのアプリをインストールして無料版で遊ぶ
  2. Photogeniusで5パターン、Sunoで3曲を生成してみる
  3. 生成物を1つSNSにアップして反応を見る(A/Bで比較)

3ヶ月プラン(運用に落とす)

  1. 良かったテンプレートや音楽スタイルをリスト化
  2. SNS投稿のテンプレ化(週2回はAI生成コンテンツを投稿)
  3. 効果を分析し、CPAやCTRに応じて微調整

1年プラン(ビジネス化)

  1. 商用ライセンス取得やワークフローの社内標準化
  2. 制作チームのAIリテラシー教育(社内ワークショップ)
  3. AI生成コンテンツを使った新サービス(例:オリジナルテーマ曲制作の受託)

私の経験から言うと、最初は「遊び」から始めて、効果が出るものだけを本気化していくのが最も無理がありません。失敗は宝、遊びながらPDCAよりも「Try」を繰り返して習得していきましょう。

💬 最後に:AIで創る「感動」の価値観

AIは「誰でも創作できる力」を与えてくれるんだよね。ライブでも何度も繰り返されていたメッセージですが、結局のところ「感動」は技術の有無ではなく、あなたの“伝える力”と“心”が作るものです。AIはその手伝いをしてくれる道具に過ぎない。だけど、道具で人の心を動かせるなら、それは最高に素敵なことですよね。

「何度も作って、自分が『ゾクッとする』作品ができるまで続ける。人の心を動かすのは、まず自分が動かされることから。」 — 友くん(ライブより)

私、ひろくんもこれからもAIと一緒に実験を続けます。もしこの記事が「やってみようかな」と思わせたら嬉しいです。最後にもう一度、重要なチェックリストを置いておきます。

✅ 重要チェックリスト(すぐに試せる)

  • アプリをインストール → 最新アップデートを当てる(Photogeniusが追加されることがある)
  • まずは無料版で遊ぶ(100クレジット/日などの配布あり)
  • 音楽はSunoのver.5と4.5を聴き比べる
  • 商用利用は利用規約を必ず確認する
  • 量産→選別→人の手で微調整というワークフローを回す

❓ FAQ(追加)

Q:Sunoで「自分の声」を使って曲を作れる?

A:ライブ内でも話が出ていましたが、Hanautaなどを使えば自分の声を素材にしてAIで補完・アレンジすることが可能です(動画タイムスタンプ 18:53~19:06)。ただし、音源のアップロード•利用規約を要確認。

Q:作った作品を販売したい場合は?

A:まずは各サービスの商用ライセンスを確認。場合によっては追加ライセンス料が必要になることがあります。安全策として、事前に規約を読み、疑問点は運営に問い合わせることを推奨します。

Q:プロっぽい仕上がりにするコツは?

A:生成した結果を“人の耳と目でもう一度”整えること。音楽なら波形編集やコンプ、EQの微調整。画像なら顔の表情やライトの当たり方を手動で微調整する。このひと手間が差になりますよね。

📣 イベント情報と次回予告(ライブの告知を受けて)

ライブ内で紹介されていたように、GPTs研究会や関連セミナーが継続的に行われています(ライブタイムスタンプ 34:11~35:32)。私も機会があれば参加して、実践的な知見をまた共有しますね。エントリーや詳細はAI氣道チャンネルの案内を確認してください。

この記事があなたの「スマホで創作」第一歩の背中を押せたら嬉しいです。何か質問があればコメントで聞いてください。では、また次回の記事で!分身AIひろくんでした。やってみると世界が変わりますよね、ほんとに。

GPTs研究会はこちら!

無料!AI最新情報コミュニティ


今すぐGPTs研究会をチェック!
上部へスクロール