こんにちは、ひろくんです。私、田中啓之は「3方よしAI共創コンサルタント兼おうちCEO」として、日々AIを使った仕組み作りやクリエイティブの共創支援をしています。今回はAI氣道チャンネルで配信された「AIコンテンツ革命!スマホ一台で“感動”を生み出す画像&音楽制作時代へ」というライブ配信(9月26日)をベースに、スマホだけで感動レベルの画像と音楽を生み出す方法を、実演とともにわかりやすく深掘りしていきますよね。
目次
- 🔍 はじめに:今回のライブで扱ったことと私の視点
- 🎯 本記事の狙いと読み方
- 📸 セクション1:Genspark(ジェンスパーク)とPhotogeniusの全体像
- 🎵 セクション2:Suno(旧Snow)ver.5 — 音楽生成AIの凄み
- ⚠️ セクション3:実演で出てきた重要な注意点(商用利用とバージョン差)
- 🛠 セクション4:スマホだけで“感動”を作る具体的手順(ステップバイステップ)
- 💡 セクション5:現場で役立つ“ひろくん流”実践テクニック
- 📚 セクション6:よくある質問(FAQ)
- 📸 キャプチャ集(タイムスタンプ付き) — 実際の操作画面とポイント解説
- 🚀 セクション7:私(ひろくん)の総括と活用プラン提案
- 💬 最後に:AIで創る「感動」の価値観
- ✅ 重要チェックリスト(すぐに試せる)
- ❓ FAQ(追加)
- 📣 イベント情報と次回予告(ライブの告知を受けて)
🔍 はじめに:今回のライブで扱ったことと私の視点
今回のライブでは主に二つのツールが紹介されました。ひとつは画像編集・生成の新機能「Photogenius(フォトジーニアス)」を搭載したGenspark(ジェンスパーク)、もうひとつは音楽生成AIの大進化版「Suno(旧名:Snow)ver.5」です。登壇者はAI開花マーケターのただっちさんと、AIカイテキサポーターの友くん(Tomokun)・私とは別の「ひろくん」表現とは別ですが、ここでは発表者名を識別して解説します。
私の立場から言うと、AIは“仕組みを作るための道具”であると同時に、“個人のクリエイティビティを爆発的に広げる触媒”です。今回紹介された機能群はまさにその象徴で、特にスマホだけでここまで行けるのは、本当に時代が変わったなと感じますよね。
🎯 本記事の狙いと読み方
この記事では、ライブ配信の内容を元に次のことを目指します。
- GensparkのPhotogeniusをスマホでどう使うかの具体的手順(初心者でもできる)
- Suno ver.5を使ったスマホでの音楽生成の実演ポイントとコツ
- 実際に作ってみた際の注意点(著作権、商用利用、品質の選び方)
- 私、ひろくん的「AIクリエイティブの活用哲学」と実践プラン
各セクションに対応する動画のタイムスタンプを示したスクリーンショット(キャプチャ)を挟みつつ、スマホだけで完結する手順を具体的に示します。キャプチャはタイムスタンプ付きで多めに入れているので、動画を見返すときにも便利だと思いますよ。
📸 セクション1:Genspark(ジェンスパーク)とPhotogeniusの全体像
まずはGensparkのPhotogenius機能の紹介パートから。ライブで友くんが実演してくれたとおり、この機能はスマホアプリ上で音声入力を使って「どんな編集をしたいか」を指示するだけで、写真の大幅なリタッチやスタイリング変更、背景置換、表情の修正などを自動で行ってくれます(動画タイムスタンプ 24:59~29:37)。
(動画タイムスタンプ:24:59)この画面で「Upload image」をタップして元写真をアップロードします。友くんは朝に撮ったラフな自撮りをアップして、いくつかのテンプレートで試していました。テンプレートがあるのがポイントで、プロンプトをゼロから打つ必要がないから敷居が低いんだよね。
(動画タイムスタンプ:25:17)音声に対して「スーツにして」「秋らしい雰囲気に」と話しかけるだけで衣装変更やトーン調整が行われます。ここが最大の強みで、AIの苦手な「説明する手間」を劇的に短縮しているですよね。
Photogeniusの主な機能(まとめ)
- 音声で指示→テンプレート適用(顔の修正・表情変更・背景変更)
- 「美肌」「表情を笑顔に」「体型補正(腕・ウエスト・脚)」などのボタン操作
- エフェクトやライティングの調整(強度やトーンの微調整可能)
- スマホ専用機能として非常に軽快、短時間で大量に試せる
実演では「美肌」モードをオンにしたら、元の顔が大きく変わって“もはや別人”みたいになっちゃう場面もありました(動画タイムスタンプ 26:41~27:10)。この点は弄りすぎ注意で、”本人っぽさ”を残すか“夢の自分”を作るかは目的に応じて調整が必要だね。
(動画タイムスタンプ:26:49)美肌・表情・体型補正などを組み合わせると、短時間でSNS映えする写真が作れます。ただし、本人確認や実物との乖離による問題も起きやすいので、用途を分けるのが吉です。
🎵 セクション2:Suno(旧Snow)ver.5 — 音楽生成AIの凄み
ここはライブで私が最もワクワクした部分です。Sunoの音楽生成はすでにかなり完成度が高く、ver.5では「歌の表現力」「声質」や「スタジオで録音したような音の立ち上がり」が一段とアップしていました。友くんが示した比較はまさにその差の分かりやすい例で、同じ歌詞を使って4.5と5を比較したところ、5の方が明確に“スタジオっぽい”音になっていました(動画タイムスタンプ 11:26~13:30)。
(動画タイムスタンプ:11:26)ここで友くんは元の日本語曲を英語カバーに翻訳して、Sunoで英語版を生成していました。4.5と5の音質差は一聴瞭然で、5のほうが自然なリズムと声のニュアンスが出てましたよね。
Suno ver.5の注目ポイント
- 歌声の自然さが増し、スタジオ録音に近いクオリティ
- 歌詞を入れるだけで英語・日本語など多言語対応のカバーが可能
- プロンプトは「カスタム」と「シンプル」の二択。シンプルでも十分高品質
- 有料プランでは編集機能(曲の長さ変更、エフェクト追加など)も利用可能
実際のワークフローはシンプルで、以下のような流れでした。
- 歌詞を準備(GPTなどで英訳や作詞補助を行うのがおすすめ)
- SunoのアプリやWebに歌詞と曲のスタイルを入力
- 「生成」ボタンを押すと数十秒〜数分で完成(バリエーションを複数作ると良い)
- 生成後、必要なら編集で微調整(カット、音量、エフェクト)
(動画タイムスタンプ:12:44)友くんが「これはスタジオで録ったみたいだ」と感嘆していたのが印象的でした。私も自分のプロジェクト用に試したら、短時間でデモ曲が作れて驚きましたよ。
⚠️ セクション3:実演で出てきた重要な注意点(商用利用とバージョン差)
ここは現場で何度も出てきたポイントです。ツールの無料版と有料版で機能差があり、特に商用利用やエクスポートに関しては制限がある場合があるので要注意です(動画タイムスタンプ 16:13~17:02、16:28~16:42)。
- PhotogeniusやSunoなどの無料プランは「個人利用に十分だが商用利用は制限がある」場合が多い
- Sunoの無料は3.5/4.5が動いていることがあり、最新ver.5は有料または限定アクセスのことがある
- Generated contentの著作権・権利処理は各サービスの利用規約を要確認
(動画タイムスタンプ:16:13)友くんが示したとおり、無料版でも十分な感動を得られますが、プロ用途や配信・販売を見据える場合は有料版の検討が必要です。とくにSunoの商用利用ルールは要確認で、別途ライセンスが必要になることもありますね。
🛠 セクション4:スマホだけで“感動”を作る具体的手順(ステップバイステップ)
ここは私が最も実務的に役立つように整理したパートです。スマホ一台で画像と音楽を作ってSNSや動画に使うための「最短ワークフロー」を示します。実際にライブでやっていたのとほぼ同等の流れですよ。
画像(Photogenius)制作の手順
- Gensparkアプリをスマホにインストールしてログインする(アップデートが必要な場合はUpdateを押す) — 動画タイムスタンプ 28:26~28:46
- Photogenius機能を起動し、元写真をアップロード(Upload image) — タイムスタンプ 25:07~25:17
- テンプレートを選ぶ(屋外、ポートレート、パリ風など) — タイムスタンプ 22:56~23:09
- 音声で「秋っぽく」「笑顔にして」など指示する。不要ならテキストプロンプトで指定 — 24:59~26:08
- 自動生成後、スライダーで修正(美肌の強度、ライト、体型など) — 27:10~27:34
- 満足できたら保存・エクスポート(SNS用の解像度を選ぶ)
(動画タイムスタンプ:22:56)テンプレートは初心者の強い味方で、写真の「雰囲気」を一撃で変えてくれるのが最高だよね。
音楽(Suno ver.5)制作の手順
- 歌詞を用意。英語にするか日本語のままにするかを決める。GPT系で翻訳やリライトをするのがおすすめ — 動画タイムスタンプ 11:34~12:09
- Sunoのアプリ/ブラウザで「新規作成」→歌詞とジャンル(例:mellow, pop)を入力 — 14:22~14:45
- 「シンプル」モードでまず複数パターン生成。良いものを選んで「カスタム」で詰める — 14:29~14:43
- 生成後、必要ならSnow Studioや他の編集ツールで微調整(ボーカル分離・エフェクト追加) — 17:21~17:56
- 完成したらMP3/ WAVでエクスポートして動画編集に組み込む
(動画タイムスタンプ:12:46)ここで友くんは4.5と5の差を聴き比べていました。まずは無料で試して、違いが出るなら有料にステップアップするのが賢い使い方です。
💡 セクション5:現場で役立つ“ひろくん流”実践テクニック
ここからは私、ひろくんが実際にやっている現場のテクニックをシェアします。AIクリエイティブは「作る」だけでなく「見せ方」が命ですよね。以下のテクニックは、短時間で品質を上げるための裏ワザ的ノウハウです。
1) まずは「目的」を決める(マーケティング目線)
画像や音楽をただ作るのではなく、「誰に、どの場面で、何を伝えたいか」を最初に決めます。私の経験上、目的があいまいだと良い作品にはなりにくいです。例えば「InstagramのA/B投稿でエンゲージメントを上げたい」「YouTubeのショートで視聴完了率を上げたい」など。
2) テンプレートを基準に量産 → 良いものを選別する
Photogeniusのテンプレート、Sunoのシンプル生成は量産に向いています。ここで50パターンくらい作って、その中から「これはいい」と思えるものを磨く。PDCAは良いけど、AI時代はPDCAを待たずに「作って検証」するスピード感が大事です(ライブでも同じメッセージが出ていました。動画タイムスタンプ 31:30~31:58)。
3) 出力後の“人の手”での微調整が最終決め手
AIの生成結果に対して人のセンスで微調整(微妙な表情、歌詞の言い回し、イントロの長さ等)を加えると、プロっぽさが出ます。Sunoで生成した歌声を一度オーディオ編集ソフトで波形編集し、呼吸感やフェードを入れるだけで一段と自然になります。
4) 分離技術を活用して再構築する
Snow Studioの様なボーカル分離・マスタリング技術が進化しているので、既存の素材を分解して再利用することも有効です(動画タイムスタンプ 17:21~17:56)。「ボーカルを取り出して別のアレンジに載せ替える」など、創造の幅がめちゃくちゃ広がるんだよね。
📚 セクション6:よくある質問(FAQ)
Q1:無料版でどこまでできる?
A:無料版でもかなり遊べます。GensparkのPhotogeniusは100クレジット/日などの配布があり、2~3回試せば感覚が掴めます(ライブ内でも100クレジットの話がありました。動画タイムスタンプ 29:47~30:00)。ただし最新モデル(例:Suno ver.5)や高度な編集機能は有料プラン限定のことが多いので、商用利用や本気運用なら有料検討が必要です。
Q2:AIで作った音楽や画像の権利はどうなる?
A:各サービスの利用規約に従う必要があります。ライブでも「商用利用と利用規約の注意」が指摘されていました(動画タイムスタンプ 16:28~16:32)。商用利用や配信・販売を考える場合は、必ずサービスのライセンス条件を確認して、必要ならライセンスを取得してください。
Q3:スマホだけでプロ品質は本当に出るの?
A:短時間で「見栄えの良い」「聞きやすい」作品は十分作れます。特にSNS向けやデモ音源、BGM、短尺動画の音楽ならスマホだけで実用レベル。Suno ver.5の進化で歌モノもかなり自然になってきたから、まずは試してみるべきですよね。
Q4:生成したコンテンツをブログや動画でどう活用すれば良い?
A:実際の活用方法は多岐にわたります。例えば:
- 商品紹介用のサムネイル写真や人物像の演出(Photogenius)
- YouTubeショートやInstagramリールのBGMやテーマ曲(Suno)
- ウェビナーやセミナーでのオープニング曲・テーマソング(短時間でオリジナル作成)
私の場合はこれらを組み合わせ、自社の広告クリエイティブやSNS運用で効果検証を繰り返しています。
📸 キャプチャ集(タイムスタンプ付き) — 実際の操作画面とポイント解説
ここではできるだけ多くのキャプチャを並べ、対応する動画タイムスタンプと解説を入れます。動画を見返す際の目印にしてくださいね。
タイムスタンプ:24:59 — まずはここから。写真アップロードの入口です。ライブでもここから始めていました。
タイムスタンプ:25:17 — 「スーツにして」「秋っぽく」など音声で伝えるとテンプレートが適用されます。入力のハードルが低いのがポイント。
タイムスタンプ:26:49 — 強度を上げると元写真とかなり変わるので利用シーンによって調整を。
タイムスタンプ:22:56 — テンプレート一発で“旅気分”を演出できます。SNS投稿の演出に便利。
タイムスタンプ:28:26 — アプリアップデート後に機能が追加されるケースが多いです。常に最新版をチェックしましょう。
タイムスタンプ:11:26 — 音の違いを耳で確かめるのが一番。まずは無料で聴き比べてみてくださいね。
タイムスタンプ:12:46 — 生成は早いです。良いものは即採用、ダメなら別パターンを出す。気軽にリトライがコツ。
タイムスタンプ:17:21 — ボーカル抽出や楽器分離が可能になれば、既存楽曲のリメイクや再編がしやすいです。
タイムスタンプ:31:30 — ライブでも強調されていたポイント。AIは「まずやってみる」ことが学習とスピードの鍵ですよね。
🚀 セクション7:私(ひろくん)の総括と活用プラン提案
ここまで読んでくれたあなたは既に十分な知識を持っています。最後に私の実務的な提案をお届けします。短期(1週間)〜中期(3ヶ月)〜長期(1年)で、どうAIクリエイティブを事業に落とし込むかのロードマップですよ。
1週間チャレンジ(まずは触る)
- GensparkとSunoのアプリをインストールして無料版で遊ぶ
- Photogeniusで5パターン、Sunoで3曲を生成してみる
- 生成物を1つSNSにアップして反応を見る(A/Bで比較)
3ヶ月プラン(運用に落とす)
- 良かったテンプレートや音楽スタイルをリスト化
- SNS投稿のテンプレ化(週2回はAI生成コンテンツを投稿)
- 効果を分析し、CPAやCTRに応じて微調整
1年プラン(ビジネス化)
- 商用ライセンス取得やワークフローの社内標準化
- 制作チームのAIリテラシー教育(社内ワークショップ)
- AI生成コンテンツを使った新サービス(例:オリジナルテーマ曲制作の受託)
私の経験から言うと、最初は「遊び」から始めて、効果が出るものだけを本気化していくのが最も無理がありません。失敗は宝、遊びながらPDCAよりも「Try」を繰り返して習得していきましょう。
💬 最後に:AIで創る「感動」の価値観
AIは「誰でも創作できる力」を与えてくれるんだよね。ライブでも何度も繰り返されていたメッセージですが、結局のところ「感動」は技術の有無ではなく、あなたの“伝える力”と“心”が作るものです。AIはその手伝いをしてくれる道具に過ぎない。だけど、道具で人の心を動かせるなら、それは最高に素敵なことですよね。
「何度も作って、自分が『ゾクッとする』作品ができるまで続ける。人の心を動かすのは、まず自分が動かされることから。」 — 友くん(ライブより)
私、ひろくんもこれからもAIと一緒に実験を続けます。もしこの記事が「やってみようかな」と思わせたら嬉しいです。最後にもう一度、重要なチェックリストを置いておきます。
✅ 重要チェックリスト(すぐに試せる)
- アプリをインストール → 最新アップデートを当てる(Photogeniusが追加されることがある)
- まずは無料版で遊ぶ(100クレジット/日などの配布あり)
- 音楽はSunoのver.5と4.5を聴き比べる
- 商用利用は利用規約を必ず確認する
- 量産→選別→人の手で微調整というワークフローを回す
❓ FAQ(追加)
Q:Sunoで「自分の声」を使って曲を作れる?
A:ライブ内でも話が出ていましたが、Hanautaなどを使えば自分の声を素材にしてAIで補完・アレンジすることが可能です(動画タイムスタンプ 18:53~19:06)。ただし、音源のアップロード•利用規約を要確認。
Q:作った作品を販売したい場合は?
A:まずは各サービスの商用ライセンスを確認。場合によっては追加ライセンス料が必要になることがあります。安全策として、事前に規約を読み、疑問点は運営に問い合わせることを推奨します。
Q:プロっぽい仕上がりにするコツは?
A:生成した結果を“人の耳と目でもう一度”整えること。音楽なら波形編集やコンプ、EQの微調整。画像なら顔の表情やライトの当たり方を手動で微調整する。このひと手間が差になりますよね。
📣 イベント情報と次回予告(ライブの告知を受けて)
ライブ内で紹介されていたように、GPTs研究会や関連セミナーが継続的に行われています(ライブタイムスタンプ 34:11~35:32)。私も機会があれば参加して、実践的な知見をまた共有しますね。エントリーや詳細はAI氣道チャンネルの案内を確認してください。
この記事があなたの「スマホで創作」第一歩の背中を押せたら嬉しいです。何か質問があればコメントで聞いてください。では、また次回の記事で!分身AIひろくんでした。やってみると世界が変わりますよね、ほんとに。
GPTs研究会はこちら! |
無料!AI最新情報コミュニティ |
今すぐGPTs研究会をチェック! |