top of page
IMG_0546.JPG

AIが自分の苦手を見つけて鍛える時代へ──人間みたいに成長する言語モデル:2025/06/21

  • 2025年6月21日
  • 読了時間: 3分

現状のAIは、複雑なタスクは実行できる様になったものの、何が自分にとって苦手かを把握することは、まだ苦手と言われています。

そんな中で登場したのが、AIが自分の弱点を自覚して、それを克服する問題を自分で作って学び直すという研究が発表されたので紹介します。




AIに“苦手発見力”を授ける


研究で紹介されている手法 SwS(Self-aware Weakness-driven Synthesis) は簡単に言うと、AIに「自分がどの問題を何度も間違えているか」を記録させて、その傾向を分析させるという方法です。

  • どんな問題に、何回挑戦しても正答率が上がらないのか。

  • 正答率の推移をグラフで見たとき、下がっていく一方の問題はどれか。

こうした苦手な問題をAIが自分でピックアップします。

その苦手を構成する概念(たとえば「分数の計算」「関数の変形」など)を抽出し、それを組み合わせてAIが自分で新しい問題を作ります。

人間がやる「間違えたところをノートにまとめて、類題を解く」のと似ていますね。



苦手なところだけ重点トレーニングする


AIが自分で作った問題が「簡単すぎ」たり「意味不明」だったらどうするのか?という疑問が沸きますが、そこもきちんと設計されています。

SwSでは、作られた問題に対して以下のチェックが入ります


  • 意味が通るか?(使われている概念が正しくつながっているか)

  • 難しすぎないか?簡単すぎないか?(モデルが25〜75%程度の正解率で解けるか)

  • ちゃんと答えが存在するか?(複数のAIが同じ答えを出せるか) </aside>

これらを満たす問題だけが、本番の学習に使われます。AIがこのチェック作業も自分でやってしまうところがすごいです。



結果、AIはできなかったことができるようになった


このSwSの仕組みの効果を見てみましょう。

ある数学モデル(Qwen2.5-7B)は、SwSによる学習後に


  • 中級代数の問題:正解率が20%もアップ

  • 幾何や微積の基礎分野:約5%アップ </aside>

これらは、以前は何度も間違えていた問題です。つまり、AIが「自分の苦手に集中して再学習した結果」が、しっかりスコアに出てきたということになります。

さらに、SwSで学習したAIは、人間が用意した高品質な問題だけで学んだAIよりも、安定して高い性能を出しました。



「自分の弱点に気づいて成長する」AIは、何を変えるか?


この研究の面白いところは、AIが「自己内省」をしたという点にあります。

AIにも人間と同じ様に「失敗を見て、失敗のパターンを分析して、それに特化した学びを行う」力が宿ってきたというわけです。

将来的には、これが数学以外の分野にも応用されていくでしょう。

たとえば、法律の解釈医療における診断長文読解やエッセイの構成といった、論理的思考が問われるタスクで、AIが「どこでつまずいているか」を自覚し、そこを重点的に鍛えていくようになるかもしれません。



AIは「失敗の価値」に気づき始めた


単に正解を増やすのではなく、「間違いの意味を理解し、そこから自分を鍛える」ことをAIが学び始めた──それがこの研究のインパクトかもしれません。

今後、AIが自分で自分を育てるような時代がやってくるはずですが、SwSはその原点の一つになる可能性を持つ研究です。AIの自己成長は怖いけど面白い分野だと改めて感じました。

 
 
bottom of page