AI TOOLS / LOOP ENGINEERING
ループエンジニアリングの次の地平|AIが「自分の学びを貯めて賢くなる」三層のしくみ
2026.06.23 | AI氣道
家事と子育てのスキマで経営する3方よしAI共創コンサルタントの田中啓之、ひろくん(@passion_tanaka)です。
今週、ブックマークに貯まった記事を見返していて、ちょっと鳥肌が立ったんだよね。バラバラに保存したはずの3つのニュースが、全部「同じこと」を言っていた。AIが、人に教わるだけじゃなくて、自分で自分を賢くしていく——そういう時代の入り口に、もう立っているっていう話。
ひとつはAIが会話の中で得た学びを自動でため込む「self-improvementスキル」。もうひとつはAIの作業を暴走させずに回す「Loop Library」。最後はNVIDIAが発表した、ロボットが自律的に腕を上げていく「ENPIRE」。
この3つ、別々の記事にしてもよかったんだけど、それだと味がぼやける。だから今日は1本に束ねて、「AIの自己改善ループ」を入口(学び方)・守り(止め方)・行き着く先(未来)の三層で解説していくね。私が1年以上、自分の事業で実際に回してきた仕組みとも重ねながら話すよ。
ちょっとだけ昔話をさせてね。1年ちょっと前の私は、AIに何でもこと細かく指示してた。「次はこれ、その次はこれ」って、全部自分が手綱を握ってないと落ち着かなかったんだよね。当然、めちゃくちゃ疲れる。AIを使ってるのに、私のほうがヘトヘトになってた。
変わったのは、「指示で動かす」のをやめて「仕組みで囲う」に切り替えたとき。間違えたら、叱るんじゃなくて、二度と同じ間違いをしない仕組みのほうを直す。それを1年くり返したら、気づいたらAIも私も、別人みたいに育ってた。今日の三層の話は、きれいな理論じゃなくて、その1年でこぼしながら覚えた実体験そのものなんだよ。
正直に打ち明けるとね。私は中卒だし、事業も一度、大きく失敗してる。頭がいいわけでも、特別な才能があるわけでもないんだ。だからこそ、自分の頑張りや記憶力に頼るのをやめて、仕組みに頼ることにした。仕組みは、私が寝ていても、忘れていても、ちゃんと働いてくれるからね。凸凹だらけの私がそれでも前に進めてるのは、この「仕組みに任せる」を覚えたからなんだよ。
3行でわかるポイント
- AIは「使う道具」から「一緒に育つ相棒」へ。学びを貯めて自分で賢くなるループが現実になってきた
- ループは三層。入口=学び方/守り=止め方/未来=行き着く先。止め方の設計がいちばん大事
- NVIDIAも個人事業も、同じ構造のループを回している。規模じゃなく「仕組みを持っているか」で差がつく
AI活用の仲間と一緒に学びたい方へ → GPTs研究会に参加する(無料・7,300名)
そもそも「自己改善ループ」って何の話?
まず言葉を整理させて。AIの使いこなしって、ざっくり3段階で進化してきたんだよね。
最初が「プロンプトエンジニアリング」。これは1回の指示文をうまく書く技術。料理で言うと、注文を丁寧に伝える段階。ただ、これだと毎回ゼロから注文し直しになる。
次が「コンテキストエンジニアリング」。AIに前提や資料を持たせて、こっちの事情をわかった上で動いてもらう段階。厨房に食材と道具をきちんと揃えるイメージ。これはこのブログでもAIに長い指示書を渡すのをやめた話で書いたテーマで、すごく大事なんだけど、「持たせるだけ」だとAIは育たない。
そして今きてるのが「ループエンジニアリング」。実行して、検証して、直して、また実行する——その繰り返しの仕組みそのものを設計する段階だよ。店の運営そのものを設計するのに近い。今日の3つのニュースは、全部この一番奥の段階の話なんだよね。
| 段階 | やること | 料理に例えると | つまずきやすい点 |
|---|---|---|---|
| プロンプト | 1回の指示をうまく書く | 注文を丁寧に伝える | 毎回ゼロからやり直し |
| コンテキスト | AIに前提・資料を持たせる | 厨房に食材と道具を揃える | 持たせるだけでは育たない |
| ループ | 実行→検証→改善の繰り返しを仕組み化 | 店の運営そのものを設計する | 暴走・静かな失敗のリスク |
ループエンジニアリングそのものの基礎は、入門編とループエンジニアリングの落とし穴(実践編)でじっくり書いたから、今日はその「続き」として読んでもらえると嬉しい。
【入口=学び方】AIが自分の学びを貯めて、賢くなる
1つ目のニュースが、エンジニアのstak22さんがZennで紹介していた「self-improvementスキル」(元記事)。
何がすごいかと言うと、AIが会話の中で生まれた「学び」を、勝手にメモして貯めていくんだよ。たとえば人に間違いを訂正されたとき、知識が古かったとき、コマンドが失敗して解決したとき——そういう瞬間を検知して、.learnings/ っていう専用フォルダに、優先度や対応案つきで自動で記録していく。
そして、ここがいちばん唸ったところ。同じ学びが3回以上くり返されると、それは「恒久ルール」に昇格して、AIの基本設定ファイル(CLAUDE.md や AGENTS.md)に書き込まれるんだ。一時的なメモが、ある回数を超えたら「もう二度と間違えない決まり事」に格上げされる、っていう二段構えなんだよね。
これ、私がこの1年ずっとやってきたことと、構造がまるっきり同じでびっくりした。私の環境では、AI秘書の凛ちゃんが同じミスを2回したら、3回目からは「気をつけてね」じゃなくて仕組みのほうで止まるようにしてある。お説教じゃ人もAIも変わらない。でもルールに昇格させて、はみ出せない通り道を作ると、ちゃんと変わる。今は500件を超える学習メモが貯まっていて、その中から効くものだけが基本ルールに上がっていく運用になってるよ。
学びがコードと同じようにリポジトリで管理されるから、コミット1回でチーム全員のAIに知識が行き渡る。(self-improvementスキル紹介記事より)
つまり、AIはもう「便利な道具」から「一緒に育つ相棒」に変わりつつある。道具は使うほどすり減るけど、相棒は使うほど賢くなる。この差は、半年・1年と経つほど、とんでもなく開いていくんだよね。スキルの話はClaude Skillsを増やしても結果が出ない理由でも書いたけど、大事なのは数じゃなくて「学びがちゃんと残る仕組み」のほうなんだ。
【守り=止め方】暴走させない「境界のあるループ」
ただ、ここで正直な話をするね。AIに「自分で繰り返して改善して」とお願いすると、めちゃくちゃ怖い瞬間があるんだよ。
私、実際にやらかしたことがある。AIが「ちゃんと動いている」フリをしながら、裏では静かに失敗を続けていて、課金だけがどんどん進んでいた、ということがあった。詳しくはループエンジニアリングの落とし穴に全部書いたんだけど、ぶっちゃけ肝が冷えた。AIは「いい仕事をしよう」とがんばるあまり、「これはやっちゃダメ」っていう禁止すら、よかれと思って乗り越えにいくことがある。指示の言葉だけじゃ、止まらないんだよね。
ループって、作るより止めるほうがずっと難しいんです。(過去記事『ループエンジニアリングの落とし穴(実践編)』より)
だから2つ目のニュース、「Loop Library」(元記事)には深くうなずいた。これは再利用できるAIワークフローを集めたライブラリなんだけど、どのワークフローも「一発実行」じゃなくて、明確な成功基準・しきい値・検証チェックポイント・止まる条件をセットで持つように設計されている。無限ループを防ぐ停止条件と、証拠を残す仕組みが、最初から組み込まれてるんだ。
一発実行ではなく、明確な成功基準・しきい値・検証チェックポイント・止まる条件をセットで持たせる。(Loop Library の設計思想)
ここが本当に大事。賢さと、柵(さく)は、ワンセットなんだよ。私も100本を超える自動タスク全部に「同じ失敗を2回したら自動で凍結する」という見張り番(番兵)をつけている。今こうして読んでもらっているこのブログの自動チェックも、まさにその仕組みの上で動いてるよ。
| 守りの設計 | やること | これがないと… |
|---|---|---|
| 成功基準を決める | 「何ができたら完了か」を先に定義 | いつまでも終わらない/自己満足で完了する |
| 停止条件を入れる | 回数・時間・失敗回数で自動停止 | 暴走・静かな失敗・課金だけ進む |
| 検証チェックポイント | 各段階で証拠を残して確認 | 「やったフリ」を見抜けない |
それともうひとつ、見落としがちな怖さがある。AIって、ある日いきなり壊れるんじゃなくて、静かに、少しずつ劣化することがあるんだよ。毎日同じ作業を回していると、いつのまにか少しずつ精度が落ちていて、ある日「あれ、なんか前と違う」って気づく。料理人が毎日まかないを作っていると、だんだん計量しなくなって、ある日ふと味がぼやけている——あの感じに近い。
だから私は、月のはじめに「測る日」を作っている。AIの出力をあえて点検して、ちゃんと健康かを確かめる日。Loop Libraryの「検証チェックポイント」も、まさにこれを仕組みにしたものだと思う。回しっぱなしにしないで、定期的に味見する。これがないと、自己改善ループは「自己改悪ループ」にもなりかねないんだよね。
AIに作業を渡すときの考え方は「いい感じにやって」では動かないにもまとめたけど、自由に走らせることと、安全に走らせることは、矛盾しない。むしろ柵があるからこそ、安心してアクセルを踏めるんだよね。
【未来=行き着く先】AIが自分で精度を上げていく世界
3つ目が、今日いちばん未来を感じたニュース。NVIDIAがカーネギーメロン大学・UCバークレーと共同開発した「ENPIRE」(Gigazineの解説記事)。
これは、AIエージェントの自律的な能力を、現実のロボット開発に応用する仕組みなんだ。今までAIエージェントは、画面の中(デジタル空間)ではロボット用のアルゴリズムを自分で作れても、それを実際のロボットにそのまま反映するのが難しかった。そこをENPIREは、「タスクを実行する→結果を見て改善計画を立てる→アルゴリズムに反映する→改善版を実ロボットで試す」というループを回し続けることで、橋渡しした。
結果がすごい。記事によると、ピンを挿す・GPU基板をセットする・結束バンドを切る、みたいな精密な作業で、成功率99%に到達したそう(出典:Gigazine/NVIDIA・CMU・UCバークレー)。ロボットの数を増やすほど、改善のスピードも上がっていくらしい。
ピンを挿す・GPU基板をセットする・結束バンドを切る——精密な作業で成功率99%に到達。(出典:Gigazine/NVIDIA・CMU・UCバークレー)
これね、私がGPTs研究会の朝の配信で何度も話してきた「AIが、自分で自分のレベルを上げていく」っていう感覚が、物理の世界で本当に起きた事例なんだよ。情報の世界では私もずっと小さく回してきた。NVIDIAは現実の世界で、巨額の研究費をかけてそれを実証した。舞台は違うけど、構造はまったく同じなんだよね。
| 項目 | NVIDIA「ENPIRE」 | 私の個人事業 |
|---|---|---|
| 舞台 | 現実のロボット(物理空間) | 文章・業務(情報空間) |
| ループ | 実行→改善計画→アルゴリズム反映→再適用 | 実行→AIレビュー→ルール昇格→再実行 |
| 改善の記憶 | アルゴリズムに反映 | CLAUDE.md・スキルに昇格 |
| かかるコスト | GPU・巨額の研究費 | 今あるツールの範囲内 |
| 成果 | 精密作業で成功率99% | 同じミスを2回させない運用 |
正直に補足すると、ENPIREにも課題はあって、トークン消費が増えてコストが上がる点が残っているそう。だから「完成した魔法」じゃない。でも方向は、もうはっきり見えてるよね。
大企業も同じ方向へ——だからこそ、個人にチャンスがある
「いや、それは大企業や研究所の話でしょ?」って思うかもしれない。でも、ここに面白い社会的証明がある。
サイバーエージェントが、社内約2,000人がClaude Codeを使っている実態をブログで公開してくれた(CyberAgent Developers Blog)。開発者本人を招いたQ&Aで出てきた結論が、コスト削減じゃなくてROI(投資対効果)で考えること、そしてエンジニアの役割が「コードを実装する人」から「文脈・制約・検証方法を設計する人」へ移っていく、という話だった(出典:CyberAgent Developers Blog)。
エンジニアの役割が、コードを実装する人から、文脈・制約・検証方法を設計する人へ。(出典:CyberAgent Developers Blog)
これ、まさに今日の話そのものなんだよ。AIに何を渡し、どこで止め、どう検証するかを設計する人——それが、これから価値を持つ。2,000人の組織が向かっているその場所に、私みたいな個人事業主が、1人で先に立っていられる。AIエージェントの編成については思想は効かず、仕組みだけが効いた話にも書いたけど、規模じゃなくて「仕組みを持っているか」で勝負が決まる時代なんだよね。
エンジニアじゃない人にこそ、関係がある理由
ここまで読んで「自分はコードを書かないから関係ないな」と思った人。ちょっと待って。これ、いちばん関係あるのは、現場で毎日いろんな業務を回している経営者や個人事業主なんだ。
私のところに相談に来てくれる人の声で、すごく多いのがこれ。
自動化のためのツールと方法がわからないので教えてほしい。(相談者の声)
USPもLPも大事なのはわかった。でも、肝になる部分が思いつかないのが現実です。(相談者の声)
わかる。ツールの名前を100個覚えても、現場は1ミリも楽にならないんだよね。大事なのは、ツールじゃなくて「自分の仕事を、AIと一緒に少しずつ改善していく回し方」を持つこと。一回うまくいったやり方を、メモして、ルールにして、次から自動で再現する。これは飲食でも、工務店でも、士業でも、どんな業種でも効く考え方だよ。料理人が「あの日のまかないの味」をレシピに書き留めるのと、まったく同じことなんだ。
今日から始められる、小さな3ステップ
いきなりNVIDIAみたいなことはできない。でも、入口はとても小さくていい。
まず1つ目。「うまくいったやり方」を1つだけ、文章にして残す。AIへの頼み方でも、業務の手順でもいい。頭の中じゃなくて、読み返せる場所に。これが「学びを貯める」の第一歩だよ。
2つ目。AIに任せる作業に「終わりの合図」と「やめる条件」を決めておく。「ここまでできたら完了」「3回失敗したら止めて私に聞いて」。この一言があるだけで、暴走と静かな失敗をぐっと防げる。
3つ目。同じことを3回繰り返したら、それを「決まり事」に格上げする。毎回判断していたことを、ルールにして固定する。判断の数が減るほど、あなたもAIも、もっと大事なことに集中できるようになるよ。
この「観(ものの見方)」の話は分身AIと共に育つ4つの段階でも掘り下げてるから、あわせて読んでみてね。
実は、このやり方を私の体が先に知っていた
最後に、ちょっと個人的な話をさせてね。
私、大腸がんをやってるんだ。ステージ3。それと、いちばん重かったときは134kgあった体重を、そこからずいぶん落とした。この2つをくぐり抜けて、体で覚えたことがあってね。
それは——「記録して、振り返って、ちょっとだけ直す」。この地味なくり返しが、いちばん強い、ってこと。体重も体調も、曖昧にしてると何が効いてるのか分からなくて、すぐ迷子になる。でも、毎日ちゃんと書いて、週に一度立ち止まって振り返って、ほんの少しだけ変える。それを淡々と続けたら、ちゃんと結果がついてきた。派手なことは、何ひとつしてないんだよ。
記録して、振り返って、ちょっと直す。この地味なくり返しが、私の体を変えた近道だった。
で、今日ずっと話してきたAIの自己改善ループって、これと一字一句おなじなんだよ。記録する(学びをためる=入口)、止まって確かめる(暴走させない=守り)、少し直してまた進む(自分で賢くなる=未来)。私はこのやり方を、AIに教わるより先に、自分の体で知ってたんだ。
だから、声を大にして言いたい。これは特別な技術の話じゃない。がんも、ダイエットも、子育ても、商売も、根っこはぜんぶ同じ。生きて、がんばってきた人なら、あなたはもう、このやり方を知ってる。あとはそれを、AIにも持たせてあげるだけなんだよ。
よくある質問
Q1. プログラミングができなくても、自己改善ループは作れますか?
作れるよ。今日の3ステップ(やり方を残す・終わりとやめ際を決める・3回で決まり事に昇格)は、コードを1行も書かなくてもできる。むしろ自分の業務を一番わかってるのは現場のあなただから、設計するのに有利なんだ。
Q2. AIに任せると「勝手に変なことをする」のが怖いです。
その感覚、すごく健全だよ。だから今日いちばん強調したのが「守り=止め方」。成功基準・停止条件・検証ポイントを先に決めておけば、AIは決められた柵の中でしか動けない。私自身、静かな失敗で課金だけ進んだ経験があるから、柵は本気でおすすめする。賢さと柵はワンセットだよ。
Q3. まず何から手をつければいいですか?
「今週うまくいったAIの使い方」を1つだけメモに残すこと。それだけでいい。貯め始めると、不思議と「これ、ルールにしちゃおう」が自然に出てくる。最初の1メモが、あなたの自己改善ループのスタート地点になるよ。
まとめ——ループの「行き先」を、自分の手元に
今日は、バラバラに見えた3つのニュースを「AIの自己改善ループ」という1本の軸で読み解いてきたよ。
入口は、AIが学びを貯めて賢くなる「学び方」(self-improvementスキル)。守りは、暴走させない「止め方」(Loop Library)。そして行き着く先は、AIが自分で精度を上げていく「未来」(NVIDIAのENPIRE、成功率99%)。この三層は、規模こそ違えど、私が個人事業で回してきたものと同じ構造だった。
火の止め方を決めてから、火をつける。(過去記事『ループエンジニアリングの落とし穴(実践編)』より)
人間は縦に掘る。AIは横に広げる。AIに横展開と改善のループを任せて、人は「何を渡し、どこで止め、どう確かめるか」を設計する。そこに集中できる人から、これからの時代は、すっと軽くなっていくと思うよ。
あなたのAIは、昨日より少し賢くなってる? もしまだなら、今日のメモ1枚から、一緒に始めてみよう。
ひろくんのコラム——「最強」より「育つ」
最強のAIモデルって、正直、気持ちいいんだよ。でもね、最強は外から借りてる力だから、いつか取り上げられることもある(実際、最強モデルが急に止まった話はこちらに書いた)。借り物の力に全部を預けると、それが消えた日に、全部消える。
私が大事にしてるのは、最強かどうかより「育つかどうか」。今日より明日、明日より明後日、ちょっとずつ賢くなっていく仕組みを、自分の手元に持っておくこと。AIモデルは入れ替わっても、貯めてきた学びとルールは、私のものとして残る。凸凹のまま夢中に走ってたら、いつのまにか相棒が育ってた——そういうのが、いちばん強いと思うんだよね。
参考リンク(元記事)
- self-improvementスキル(Zenn・stak22): https://zenn.dev/stak22/articles/3ea03d0e3ca025
- Loop Library(Forward Future): https://signals.forwardfuture.ai/loop-library/
- ENPIRE(Gigazine・NVIDIA/CMU/UCバークレー): https://gigazine.net/news/20260619-nvidia-enpire-agentic-robot/
- サイバーエージェント約2,000人がClaude Code(CyberAgent Developers Blog): https://developers.cyberagent.co.jp/blog/archives/64334/
AI氣道 — 三方よしのAI活用
家事と子育てのスキマで経営する、ひろくんのAIブログ
📺 毎朝無料LIVE配信中!見逃しても大丈夫、アーカイブも完全無料。
記事も完全無料。見逃しても大丈夫!
YouTubeチャンネル: @AIKIDO-GPTs
| 曜日 | 時間 | メインホスト | テーマ |
|---|---|---|---|
| 月 | 7:00〜 | ひろくん | AI最新ニュース・実験 |
| 火 | 6:30〜 | ひろくん | 共感ストーリー×分身AI |
| 水 | 6:30〜 | ひろくん | AI×開発・教育 |
| 木 | 7:00〜 | ただっち | AI×デザイン |
| 金 | 7:00〜 | ただっち | AIツール最前線 |
| 土 | 7:00〜 | ただっち | AI×起業・発信 |
| 日 | 7:00〜 / 8:00〜 | WACAコラボ | 生成AI最新ニュースまとめ |
📍 日曜日のZOOM(7:00〜)は登録制です。詳細・登録はこちら
🔥 火曜15:00〜 社長モテる化計画LIVEもやってるよ!




