Commentary
DeepSeekの衝撃(続)
「開放性」は「地政学」に勝つ

DeepSeekはなぜ優れているのか?
では、DeepSeekは、OpenAIなどに比べて性能が劣るICしか入手できない状況のなかで、いかにしてそれらより効率的に生成AIを作ることができたのだろうか。OpenAI側はDeepSeekのモデルはOpenAIのモデルを不正に「蒸留」して作成したものだと非難している(『Gigazine』、2025年1月30日)。
「蒸留」とは、AIが世の中のいろいろなデータを学習する際に、まず大きなモデルに学ばせておいて、そのエッセンスを小さなモデルに詰め込むことを指す。DeepSeek自身も、その推論モデルDeepSeek-R1をより小さくした蒸留版を公開している。
ただ、もともと生成AIの訓練にはインターネット上にある膨大な情報を集めて学習するので、DeepSeekの訓練過程で学習するなかにはOpenAIのGPTなど他社の生成AIが推論して出力した結果も含まれる。生成AI同士がそうやって互いに参照し合うのはこの業界の常識だと指摘されており(劉・屈、2025)、それを指して不正な「蒸留」だというのであれば、およそ大規模言語モデルはどれも不正をやっていることになってしまう。
「蒸留」にはもう一つ狭い意味があり、それはある動物の画像を見てそれが犬である確率は60%、猫である確率は40%という確率分布を大きなモデルによって計算し、その確率分布を小さなモデルに学ばせることによって学習効率を上げることを指す(斎藤、2025)。OpenAIはそうした確率分布を社外には公開していないので、もしDeepSeekがそれを取得したとしたらそれは不正ということになる。
しかし、試験で隣の学生の答案をのぞきこんでカンニングすることを想定すれば分かるように、カンニングによって隣の学生よりもすばやく答案を書けるかもしれないが、カンニングだけでは隣の学生より良い成績を取ることはできないだろう。DeepSeek-V3が多くの側面でGPT-4oよりも好成績を挙げていることは、「蒸留」だけでは説明できない。
結局のところ、DeepSeekのモデルがより優れていたからこそ、低コストでChatGPTなどを上回る成績を上げることができたのではないだろうか。モデルの概要についてはDeepSeekのウェブサイトに掲載されているテクニカルレポート(DeepSeek-AI, 2025)に書かれている。その内容を理解して紹介する能力は残念ながら私にはないが、Multi-head latent attention とDeepSeekMoEの二つが重要な技術らしい。
Multi-head attentionとは、入力されてくる文章や画像を分析してその注目点を計算する効率的な方法として2017年にグーグルが開発し、それ以降生成AIでは広く使われている。DeepSeekのMulti-head latent attentionとは、注目点を計算するための鍵(key)と値(value)を圧縮して共通化することによって計算作業をさらに効率化する方法なのだという。
また、MoE(Mixture-of-experts 複数の専門家)とは、AIがいろいろな文章を学習していくにあたって、頭脳のなかに化学の専門家、文学の専門家、といったように多数の「専門家」を用意し、入力されてくる文章に応じてそれに適した専門家たちを動員して学習していくという仕組みで、これもOpenAIなど他社も採用している。DeepSeekMoEは専門家をより細分化することと、常に動員する共通の専門家を用意して共通性の高い知識を学習させることに特徴がある。以上二つとも生成AIの世界ではかなり広く使われている計算方法であり、DeepSeekが行ったことはそれらを部分的に改良することであったが、それでも格段に高い効率を実現した。
DeepSeekの背景
DeepSeekを生み出した幻方量化とはいったいいかなる会社なのであろうか。その創立者の梁文鋒は1985年に広東省湛江市生まれ。17歳で浙江大学電子情報エンジニアリング科に入学し、同大学の修士課程を修了した。2015年に株などの高速取引を行うクオンツ・ファンド、幻方量化を創立し、成功を収めて2021年には資産規模を1000億元近くにまで拡大した(劉・屈、2025)。
梁文鋒は高速取引を行うためにAIに関心を持ち、2021年までに10億元を投じてエヌビディアのA100を1万個以上も購入した。2023年5月に社内にAIチームを立ち上げ、これをDeepSeekと称した。DeepSeekが業界の注目を集めたのは2024年5月に発表したDeepSeek-V2による。この段階ですでにMulti-head latent attention とDeepSeekMoEというDeepSeekの独自技術が使われていた(DeepSeek-AI, 2024)。
DeepSeekで特筆すべき点は開発した生成AIがすべてオープンソースになっていることである。DeepSeek-V3のファイルサイズは700GBと大きいものの、ユーザーはそれをダウンロードして使ったり、改良したりできる(The Economist, 2025)。そればかりか、その技術に関する詳細な論文が公開されており、そこにはそれを作成したスタッフの名前も掲載されている。一方、ライバルのChatGPTやClaudeはクローズドであり、その技術の中身に関する情報も限られている。
もしDeepSeek-V3が中国の悪い面について口ごもることが気に入らないのであれば、ダウンロードして中国の暗部について再教育すればいいのであり、それを利用して自分の入力内容が中国政府に筒抜けになることが心配なのであれば、自国のサーバーにインストールして使えばよいのである。
さっそくメタでは4つの作戦室を設けてDeepSeekをダウンロードして解析し、自社のモデルを改善するためのリバース・エンジニアリングに取り組んでいるそうである(劉・屈、2025)。
また、マイクロソフトのチャットボットCopilotはGPT-4を利用しているが、『財新網』の報道によれば、CopilotではDeepSeekの推理モデルR1も使い始めているという(劉、2025)。もっとも、Copilotにこの件について質問してみたところ、英語で尋ねたら「自分の技術については知りません」とはぐらかし、中国語で聞いたら「DeepSeekとは関係ありません」と否定した。とはいえ、DeepSeekはオープンソースであるだけに、今後いろいろなウェブサイトや機器にビルトインされて、私たちも知らず知らずのうちに使うようになるかもしれない。
開放性は地政学に勝つ
DeepSeekのオープンな姿勢は、この会社が生成AI開発を科学として捉えていることを示している。科学者は先人の肩の上に立って新たな科学的成果を生み出していく。他人の貢献を自分のものだと偽ることは科学のルール違反だが、他人の科学的成果を利用することはタダである。そうした世界では「覇権争い」などというものは存在しない。科学的成果は公開の論文という形で公表されるので、誰でもその成果を利用できるからである。
一方、「技術」となると、特許を取得することで、他者がそれを利用することに制限を加えたり、利用料を取ったりできる。もしある技術が普及することが、他の類似の技術の利用を妨げたり、不要にしたりする場合には「技術覇権」が成り立つことがある。しかし、生成AIの場合には排他性がないため、「技術覇権」は形成されないだろう。
ICの輸出規制を強化しろと息巻いているアメリカの議員たちや生成AIをめぐる競争を「米中の覇権争い」と捉える日本の新聞・テレビは、この競争を地政学的に捉えている。地政学は世界を帝国主義国間の植民地獲得競争のように見なす世界観に立つ。その観点からいえば、中国が前進することはそのライバル国たちが後退することである。もしアメリカのICメーカーがICを輸出して中国の生成AIの前進を助けるようなことがあれば、それは利敵行為と見なされる。そうした観点からいえば、中国の生成AIの進歩を止めなければならない、ということになる。
アメリカ政府は地政学的な観点に立って、中国のAIの発展に必要なICの輸出を制限し、中国のAIを「兵糧攻め」に遭わせてきた。しかし、DeepSeek-V3がGPT-4oなどを上回る好成績を挙げたことは、科学の力で資源の不足を乗り越えることができることを示した。科学の力とはすなわち国境を超えてさまざまな人々が生み出した知識を自由に利用し合う開放性の力と言い換えることができる。
DeepSeekなど中国のAIの進歩に対抗するのに、ICの輸出管理をさらに強めたり、アメリカ国内や日本などの同盟国でDeepSeekの利用を禁じたりするといった地政学的な対抗策を採ることは、自らのIC産業を弱体化させ、自らのAIの進歩を遅らせる自傷行為にしかならないだろう。本来、生成AIとは世界中のインターネット上に散らばる知識や言葉を学習するものであり、開放的な環境がなければ育ちようがない。
競争の勝敗を分けるのは、何らかの特殊な資源を握っているか否かではなく、世の中の知識や言葉を効率的に学ぶ計算方法を編み出せるかどうかである。その計算方法を競争相手も学んで改良できるのであれば、ライバルの前進を自分の前進につなげることができる。開放性は進歩をもたらし、地政学は進歩を妨げる。
その点では、国外のSNSへのアクセスを制限している中国政府も、中国の生成AIに対する兵糧を断つことで窒息させようとしているアメリカ政府と同罪である。長い目で見ればいずれも科学と開放性の力に負けるに違いない。
関連記事:「DeepSeekの衝撃――米中の「覇権争い」という誤解」を読む
参考文献
斎藤健二「DeepSeekで注目された「蒸留」って何だ? 識者が解説」『ITmedia AI+』2025年2月7日
DeepSeek-AI, DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-experts Language Model. May 2024.
DeepSeek-AI, DeepSeek-V3 Technical Report, January 2025.
The Economist. “Uncomfortably close.” The Economist, January 25, 2025.
劉沛林「DeepSeek走紅 英偉達、微軟、華為、騰訊等推相関服務」『財新網』2025年2月2日。 劉沛林・屈運栩「DeepSeek爆火 撼動AI投資和算力競争底層邏輯」『財新周刊』2025年第5期。