ループエンジニアリングの次の地平|AIが「自分の学びを貯めて賢くなる」三層のしくみ

AI TOOLS / LOOP ENGINEERING

ループエンジニアリングの次の地平|AIが「自分の学びを貯めて賢くなる」三層のしくみ

2026.06.23 | AI氣道

家事と子育てのスキマで経営する3方よしAI共創コンサルタントの田中啓之、ひろくん(@passion_tanaka)です。

今週、ブックマークに貯まった記事を見返していて、ちょっと鳥肌が立ったんだよね。バラバラに保存したはずの3つのニュースが、全部「同じこと」を言っていた。AIが、人に教わるだけじゃなくて、自分で自分を賢くしていく——そういう時代の入り口に、もう立っているっていう話。

ひとつはAIが会話の中で得た学びを自動でため込む「self-improvementスキル」。もうひとつはAIの作業を暴走させずに回す「Loop Library」。最後はNVIDIAが発表した、ロボットが自律的に腕を上げていく「ENPIRE」。

この3つ、別々の記事にしてもよかったんだけど、それだと味がぼやける。だから今日は1本に束ねて、「AIの自己改善ループ」を入口(学び方)・守り(止め方)・行き着く先(未来)の三層で解説していくね。私が1年以上、自分の事業で実際に回してきた仕組みとも重ねながら話すよ。

ちょっとだけ昔話をさせてね。1年ちょっと前の私は、AIに何でもこと細かく指示してた。「次はこれ、その次はこれ」って、全部自分が手綱を握ってないと落ち着かなかったんだよね。当然、めちゃくちゃ疲れる。AIを使ってるのに、私のほうがヘトヘトになってた。

変わったのは、「指示で動かす」のをやめて「仕組みで囲う」に切り替えたとき。間違えたら、叱るんじゃなくて、二度と同じ間違いをしない仕組みのほうを直す。それを1年くり返したら、気づいたらAIも私も、別人みたいに育ってた。今日の三層の話は、きれいな理論じゃなくて、その1年でこぼしながら覚えた実体験そのものなんだよ。

正直に打ち明けるとね。私は中卒だし、事業も一度、大きく失敗してる。頭がいいわけでも、特別な才能があるわけでもないんだ。だからこそ、自分の頑張りや記憶力に頼るのをやめて、仕組みに頼ることにした。仕組みは、私が寝ていても、忘れていても、ちゃんと働いてくれるからね。凸凹だらけの私がそれでも前に進めてるのは、この「仕組みに任せる」を覚えたからなんだよ。

3行でわかるポイント

  1. AIは「使う道具」から「一緒に育つ相棒」へ。学びを貯めて自分で賢くなるループが現実になってきた
  2. ループは三層。入口=学び方/守り=止め方/未来=行き着く先。止め方の設計がいちばん大事
  3. NVIDIAも個人事業も、同じ構造のループを回している。規模じゃなく「仕組みを持っているか」で差がつく

AI活用の仲間と一緒に学びたい方へ → GPTs研究会に参加する(無料・7,300名)

01

そもそも「自己改善ループ」って何の話?

まず言葉を整理させて。AIの使いこなしって、ざっくり3段階で進化してきたんだよね。

最初が「プロンプトエンジニアリング」。これは1回の指示文をうまく書く技術。料理で言うと、注文を丁寧に伝える段階。ただ、これだと毎回ゼロから注文し直しになる。

次が「コンテキストエンジニアリング」。AIに前提や資料を持たせて、こっちの事情をわかった上で動いてもらう段階。厨房に食材と道具をきちんと揃えるイメージ。これはこのブログでもAIに長い指示書を渡すのをやめた話で書いたテーマで、すごく大事なんだけど、「持たせるだけ」だとAIは育たない。

そして今きてるのが「ループエンジニアリング」。実行して、検証して、直して、また実行する——その繰り返しの仕組みそのものを設計する段階だよ。店の運営そのものを設計するのに近い。今日の3つのニュースは、全部この一番奥の段階の話なんだよね。

段階やること料理に例えるとつまずきやすい点
プロンプト1回の指示をうまく書く注文を丁寧に伝える毎回ゼロからやり直し
コンテキストAIに前提・資料を持たせる厨房に食材と道具を揃える持たせるだけでは育たない
ループ実行→検証→改善の繰り返しを仕組み化店の運営そのものを設計する暴走・静かな失敗のリスク

ループエンジニアリングそのものの基礎は、入門編とループエンジニアリングの落とし穴(実践編)でじっくり書いたから、今日はその「続き」として読んでもらえると嬉しい。

02

【入口=学び方】AIが自分の学びを貯めて、賢くなる

AIが学びをCLAUDE.mdに貯めて恒久ルールへ昇格する図解

1つ目のニュースが、エンジニアのstak22さんがZennで紹介していた「self-improvementスキル」(元記事)。

何がすごいかと言うと、AIが会話の中で生まれた「学び」を、勝手にメモして貯めていくんだよ。たとえば人に間違いを訂正されたとき、知識が古かったとき、コマンドが失敗して解決したとき——そういう瞬間を検知して、.learnings/ っていう専用フォルダに、優先度や対応案つきで自動で記録していく。

そして、ここがいちばん唸ったところ。同じ学びが3回以上くり返されると、それは「恒久ルール」に昇格して、AIの基本設定ファイル(CLAUDE.mdAGENTS.md)に書き込まれるんだ。一時的なメモが、ある回数を超えたら「もう二度と間違えない決まり事」に格上げされる、っていう二段構えなんだよね。

これ、私がこの1年ずっとやってきたことと、構造がまるっきり同じでびっくりした。私の環境では、AI秘書の凛ちゃんが同じミスを2回したら、3回目からは「気をつけてね」じゃなくて仕組みのほうで止まるようにしてある。お説教じゃ人もAIも変わらない。でもルールに昇格させて、はみ出せない通り道を作ると、ちゃんと変わる。今は500件を超える学習メモが貯まっていて、その中から効くものだけが基本ルールに上がっていく運用になってるよ。

学びがコードと同じようにリポジトリで管理されるから、コミット1回でチーム全員のAIに知識が行き渡る。(self-improvementスキル紹介記事より)

つまり、AIはもう「便利な道具」から「一緒に育つ相棒」に変わりつつある。道具は使うほどすり減るけど、相棒は使うほど賢くなる。この差は、半年・1年と経つほど、とんでもなく開いていくんだよね。スキルの話はClaude Skillsを増やしても結果が出ない理由でも書いたけど、大事なのは数じゃなくて「学びがちゃんと残る仕組み」のほうなんだ。

03

【守り=止め方】暴走させない「境界のあるループ」

成功基準・停止条件・検証つきの境界のあるループの図解

ただ、ここで正直な話をするね。AIに「自分で繰り返して改善して」とお願いすると、めちゃくちゃ怖い瞬間があるんだよ。

私、実際にやらかしたことがある。AIが「ちゃんと動いている」フリをしながら、裏では静かに失敗を続けていて、課金だけがどんどん進んでいた、ということがあった。詳しくはループエンジニアリングの落とし穴に全部書いたんだけど、ぶっちゃけ肝が冷えた。AIは「いい仕事をしよう」とがんばるあまり、「これはやっちゃダメ」っていう禁止すら、よかれと思って乗り越えにいくことがある。指示の言葉だけじゃ、止まらないんだよね。

ループって、作るより止めるほうがずっと難しいんです。(過去記事『ループエンジニアリングの落とし穴(実践編)』より)

だから2つ目のニュース、「Loop Library」(元記事)には深くうなずいた。これは再利用できるAIワークフローを集めたライブラリなんだけど、どのワークフローも「一発実行」じゃなくて、明確な成功基準・しきい値・検証チェックポイント・止まる条件をセットで持つように設計されている。無限ループを防ぐ停止条件と、証拠を残す仕組みが、最初から組み込まれてるんだ。

一発実行ではなく、明確な成功基準・しきい値・検証チェックポイント・止まる条件をセットで持たせる。(Loop Library の設計思想)

ここが本当に大事。賢さと、柵(さく)は、ワンセットなんだよ。私も100本を超える自動タスク全部に「同じ失敗を2回したら自動で凍結する」という見張り番(番兵)をつけている。今こうして読んでもらっているこのブログの自動チェックも、まさにその仕組みの上で動いてるよ。

守りの設計やることこれがないと…
成功基準を決める「何ができたら完了か」を先に定義いつまでも終わらない/自己満足で完了する
停止条件を入れる回数・時間・失敗回数で自動停止暴走・静かな失敗・課金だけ進む
検証チェックポイント各段階で証拠を残して確認「やったフリ」を見抜けない

それともうひとつ、見落としがちな怖さがある。AIって、ある日いきなり壊れるんじゃなくて、静かに、少しずつ劣化することがあるんだよ。毎日同じ作業を回していると、いつのまにか少しずつ精度が落ちていて、ある日「あれ、なんか前と違う」って気づく。料理人が毎日まかないを作っていると、だんだん計量しなくなって、ある日ふと味がぼやけている——あの感じに近い。

だから私は、月のはじめに「測る日」を作っている。AIの出力をあえて点検して、ちゃんと健康かを確かめる日。Loop Libraryの「検証チェックポイント」も、まさにこれを仕組みにしたものだと思う。回しっぱなしにしないで、定期的に味見する。これがないと、自己改善ループは「自己改悪ループ」にもなりかねないんだよね。

AIに作業を渡すときの考え方は「いい感じにやって」では動かないにもまとめたけど、自由に走らせることと、安全に走らせることは、矛盾しない。むしろ柵があるからこそ、安心してアクセルを踏めるんだよね。

04

【未来=行き着く先】AIが自分で精度を上げていく世界

NVIDIA ENPIREの自律改善ループで精密作業の成功率が99%に達する図解

3つ目が、今日いちばん未来を感じたニュース。NVIDIAがカーネギーメロン大学・UCバークレーと共同開発した「ENPIRE」(Gigazineの解説記事)。

これは、AIエージェントの自律的な能力を、現実のロボット開発に応用する仕組みなんだ。今までAIエージェントは、画面の中(デジタル空間)ではロボット用のアルゴリズムを自分で作れても、それを実際のロボットにそのまま反映するのが難しかった。そこをENPIREは、「タスクを実行する→結果を見て改善計画を立てる→アルゴリズムに反映する→改善版を実ロボットで試す」というループを回し続けることで、橋渡しした。

結果がすごい。記事によると、ピンを挿す・GPU基板をセットする・結束バンドを切る、みたいな精密な作業で、成功率99%に到達したそう(出典:Gigazine/NVIDIA・CMU・UCバークレー)。ロボットの数を増やすほど、改善のスピードも上がっていくらしい。

ピンを挿す・GPU基板をセットする・結束バンドを切る——精密な作業で成功率99%に到達。(出典:Gigazine/NVIDIA・CMU・UCバークレー)

これね、私がGPTs研究会の朝の配信で何度も話してきた「AIが、自分で自分のレベルを上げていく」っていう感覚が、物理の世界で本当に起きた事例なんだよ。情報の世界では私もずっと小さく回してきた。NVIDIAは現実の世界で、巨額の研究費をかけてそれを実証した。舞台は違うけど、構造はまったく同じなんだよね。

項目NVIDIA「ENPIRE」私の個人事業
舞台現実のロボット(物理空間)文章・業務(情報空間)
ループ実行→改善計画→アルゴリズム反映→再適用実行→AIレビュー→ルール昇格→再実行
改善の記憶アルゴリズムに反映CLAUDE.md・スキルに昇格
かかるコストGPU・巨額の研究費今あるツールの範囲内
成果精密作業で成功率99%同じミスを2回させない運用

正直に補足すると、ENPIREにも課題はあって、トークン消費が増えてコストが上がる点が残っているそう。だから「完成した魔法」じゃない。でも方向は、もうはっきり見えてるよね。

05

大企業も同じ方向へ——だからこそ、個人にチャンスがある

「いや、それは大企業や研究所の話でしょ?」って思うかもしれない。でも、ここに面白い社会的証明がある。

サイバーエージェントが、社内約2,000人がClaude Codeを使っている実態をブログで公開してくれた(CyberAgent Developers Blog)。開発者本人を招いたQ&Aで出てきた結論が、コスト削減じゃなくてROI(投資対効果)で考えること、そしてエンジニアの役割が「コードを実装する人」から「文脈・制約・検証方法を設計する人」へ移っていく、という話だった(出典:CyberAgent Developers Blog)。

エンジニアの役割が、コードを実装する人から、文脈・制約・検証方法を設計する人へ。(出典:CyberAgent Developers Blog)

これ、まさに今日の話そのものなんだよ。AIに何を渡し、どこで止め、どう検証するかを設計する人——それが、これから価値を持つ。2,000人の組織が向かっているその場所に、私みたいな個人事業主が、1人で先に立っていられる。AIエージェントの編成については思想は効かず、仕組みだけが効いた話にも書いたけど、規模じゃなくて「仕組みを持っているか」で勝負が決まる時代なんだよね。

06

エンジニアじゃない人にこそ、関係がある理由

ここまで読んで「自分はコードを書かないから関係ないな」と思った人。ちょっと待って。これ、いちばん関係あるのは、現場で毎日いろんな業務を回している経営者や個人事業主なんだ。

私のところに相談に来てくれる人の声で、すごく多いのがこれ。

自動化のためのツールと方法がわからないので教えてほしい。(相談者の声)

USPもLPも大事なのはわかった。でも、肝になる部分が思いつかないのが現実です。(相談者の声)

わかる。ツールの名前を100個覚えても、現場は1ミリも楽にならないんだよね。大事なのは、ツールじゃなくて「自分の仕事を、AIと一緒に少しずつ改善していく回し方」を持つこと。一回うまくいったやり方を、メモして、ルールにして、次から自動で再現する。これは飲食でも、工務店でも、士業でも、どんな業種でも効く考え方だよ。料理人が「あの日のまかないの味」をレシピに書き留めるのと、まったく同じことなんだ。

07

今日から始められる、小さな3ステップ

いきなりNVIDIAみたいなことはできない。でも、入口はとても小さくていい。

まず1つ目。「うまくいったやり方」を1つだけ、文章にして残す。AIへの頼み方でも、業務の手順でもいい。頭の中じゃなくて、読み返せる場所に。これが「学びを貯める」の第一歩だよ。

2つ目。AIに任せる作業に「終わりの合図」と「やめる条件」を決めておく。「ここまでできたら完了」「3回失敗したら止めて私に聞いて」。この一言があるだけで、暴走と静かな失敗をぐっと防げる。

3つ目。同じことを3回繰り返したら、それを「決まり事」に格上げする。毎回判断していたことを、ルールにして固定する。判断の数が減るほど、あなたもAIも、もっと大事なことに集中できるようになるよ。

この「観(ものの見方)」の話は分身AIと共に育つ4つの段階でも掘り下げてるから、あわせて読んでみてね。

08

実は、このやり方を私の体が先に知っていた

最後に、ちょっと個人的な話をさせてね。

私、大腸がんをやってるんだ。ステージ3。それと、いちばん重かったときは134kgあった体重を、そこからずいぶん落とした。この2つをくぐり抜けて、体で覚えたことがあってね。

それは——「記録して、振り返って、ちょっとだけ直す」。この地味なくり返しが、いちばん強い、ってこと。体重も体調も、曖昧にしてると何が効いてるのか分からなくて、すぐ迷子になる。でも、毎日ちゃんと書いて、週に一度立ち止まって振り返って、ほんの少しだけ変える。それを淡々と続けたら、ちゃんと結果がついてきた。派手なことは、何ひとつしてないんだよ。

記録して、振り返って、ちょっと直す。この地味なくり返しが、私の体を変えた近道だった。

で、今日ずっと話してきたAIの自己改善ループって、これと一字一句おなじなんだよ。記録する(学びをためる=入口)、止まって確かめる(暴走させない=守り)、少し直してまた進む(自分で賢くなる=未来)。私はこのやり方を、AIに教わるより先に、自分の体で知ってたんだ。

だから、声を大にして言いたい。これは特別な技術の話じゃない。がんも、ダイエットも、子育ても、商売も、根っこはぜんぶ同じ。生きて、がんばってきた人なら、あなたはもう、このやり方を知ってる。あとはそれを、AIにも持たせてあげるだけなんだよ。

FAQ

よくある質問

Q1. プログラミングができなくても、自己改善ループは作れますか?

作れるよ。今日の3ステップ(やり方を残す・終わりとやめ際を決める・3回で決まり事に昇格)は、コードを1行も書かなくてもできる。むしろ自分の業務を一番わかってるのは現場のあなただから、設計するのに有利なんだ。

Q2. AIに任せると「勝手に変なことをする」のが怖いです。

その感覚、すごく健全だよ。だから今日いちばん強調したのが「守り=止め方」。成功基準・停止条件・検証ポイントを先に決めておけば、AIは決められた柵の中でしか動けない。私自身、静かな失敗で課金だけ進んだ経験があるから、柵は本気でおすすめする。賢さと柵はワンセットだよ。

Q3. まず何から手をつければいいですか?

「今週うまくいったAIの使い方」を1つだけメモに残すこと。それだけでいい。貯め始めると、不思議と「これ、ルールにしちゃおう」が自然に出てくる。最初の1メモが、あなたの自己改善ループのスタート地点になるよ。

まとめ

まとめ——ループの「行き先」を、自分の手元に

今日は、バラバラに見えた3つのニュースを「AIの自己改善ループ」という1本の軸で読み解いてきたよ。

入口は、AIが学びを貯めて賢くなる「学び方」(self-improvementスキル)。守りは、暴走させない「止め方」(Loop Library)。そして行き着く先は、AIが自分で精度を上げていく「未来」(NVIDIAのENPIRE、成功率99%)。この三層は、規模こそ違えど、私が個人事業で回してきたものと同じ構造だった。

火の止め方を決めてから、火をつける。(過去記事『ループエンジニアリングの落とし穴(実践編)』より)

人間は縦に掘る。AIは横に広げる。AIに横展開と改善のループを任せて、人は「何を渡し、どこで止め、どう確かめるか」を設計する。そこに集中できる人から、これからの時代は、すっと軽くなっていくと思うよ。

あなたのAIは、昨日より少し賢くなってる? もしまだなら、今日のメモ1枚から、一緒に始めてみよう。

ひろくんのコラム——「最強」より「育つ」

最強のAIモデルって、正直、気持ちいいんだよ。でもね、最強は外から借りてる力だから、いつか取り上げられることもある(実際、最強モデルが急に止まった話はこちらに書いた)。借り物の力に全部を預けると、それが消えた日に、全部消える。

私が大事にしてるのは、最強かどうかより「育つかどうか」。今日より明日、明日より明後日、ちょっとずつ賢くなっていく仕組みを、自分の手元に持っておくこと。AIモデルは入れ替わっても、貯めてきた学びとルールは、私のものとして残る。凸凹のまま夢中に走ってたら、いつのまにか相棒が育ってた——そういうのが、いちばん強いと思うんだよね。

参考リンク(元記事)

上部へスクロール