AIが自分の苦手を見つけて鍛える時代へ──人間みたいに成長する言語モデル：2025/06/21

現状のAIは、複雑なタスクは実行できる様になったものの、何が自分にとって苦手かを把握することは、まだ苦手と言われています。

そんな中で登場したのが、AIが自分の弱点を自覚して、それを克服する問題を自分で作って学び直すという研究が発表されたので紹介します。

研究で紹介されている手法 SwS（Self-aware Weakness-driven Synthesis）は簡単に言うと、AIに「自分がどの問題を何度も間違えているか」を記録させて、その傾向を分析させるという方法です。

こうした苦手な問題をAIが自分でピックアップします。

その苦手を構成する概念（たとえば「分数の計算」「関数の変形」など）を抽出し、それを組み合わせてAIが自分で新しい問題を作ります。

人間がやる「間違えたところをノートにまとめて、類題を解く」のと似ていますね。

AIが自分で作った問題が「簡単すぎ」たり「意味不明」だったらどうするのか？という疑問が沸きますが、そこもきちんと設計されています。

SwSでは、作られた問題に対して以下のチェックが入ります

これらを満たす問題だけが、本番の学習に使われます。AIがこのチェック作業も自分でやってしまうところがすごいです。

このSwSの仕組みの効果を見てみましょう。

ある数学モデル（Qwen2.5-7B）は、SwSによる学習後に

これらは、以前は何度も間違えていた問題です。つまり、AIが「自分の苦手に集中して再学習した結果」が、しっかりスコアに出てきたということになります。

さらに、SwSで学習したAIは、人間が用意した高品質な問題だけで学んだAIよりも、安定して高い性能を出しました。

この研究の面白いところは、AIが「自己内省」をしたという点にあります。

AIにも人間と同じ様に「失敗を見て、失敗のパターンを分析して、それに特化した学びを行う」力が宿ってきたというわけです。

将来的には、これが数学以外の分野にも応用されていくでしょう。

たとえば、法律の解釈や医療における診断、長文読解やエッセイの構成といった、論理的思考が問われるタスクで、AIが「どこでつまずいているか」を自覚し、そこを重点的に鍛えていくようになるかもしれません。

単に正解を増やすのではなく、「間違いの意味を理解し、そこから自分を鍛える」ことをAIが学び始めた──それがこの研究のインパクトかもしれません。

今後、AIが自分で自分を育てるような時代がやってくるはずですが、SwSはその原点の一つになる可能性を持つ研究です。AIの自己成長は怖いけど面白い分野だと改めて感じました。