推論特化AIが「木漏れ日」を「Drought Day(干ばつの日)」と訳した話——deepseek-r1:7b 24問テスト
Zenn
Share
2026年03月17日AI(AIチャット)

推論特化AIが「木漏れ日」を「Drought Day(干ばつの日)」と訳した話——deepseek-r1:7b 24問テスト

要約・抽出情報

「推論特化」と聞いて、少し期待した。DeepSeek-R1は2025年1月にOpenAI o1と同等と言われて話題になったモデルだ。その7B蒸留版ならローカルでも戦えるかもしれない。 結果は 94/240点(39.2%)ランクD。4モデル中最下位だった。 何が起きたか 6問がタイムアウト(180秒) で回答ゼロになった。 川渡り問題、FizzBuzz拡張、再帰フィボナッチ、正規表現、敬語、俳句——どれも「答えが一つに絞れない」か「文脈から判断する」タイプの問題だ。thinking(推論ステップ)が止まらなくなり、力尽きた。 蒸留モデルの宿命でもある。R1本体は「どこで考えを止めるか...

この記事をシェアする

Share

この記事の詳細はオリジナルサイトでご確認ください

オリジナルサイトで読む