AI14分で読める

AI先駆者フェイフェイ・リーのWorld Labsが$1B追加調達——「空間知能」で3D世界を理解するAI

ImageNetの生みの親であり、現代のコンピュータビジョン研究を牽引してきたフェイフェイ・リー(李飛飛)。彼女が2023年に創業したWorld Labsが、2026年3月に**$1B(約1,500億円)の新規資金調達を完了した。Series Aで調達した$230Mと合わせ、累計調達額は$1.23B(約1,845億円)**に達する。評価額は$5B(約7,500億円)を超えたとみられ、AI分野でも屈指のユニコーンに成長した。

同社が開発するのは「空間知能(Spatial Intelligence)」と呼ばれる技術だ。テキストや画像を処理する従来のLLMとは異なり、3次元の物理空間を理解し、生成し、操作できるAI基盤モデルを構築している。ロボティクス、AR/VR、自動運転、ゲーム開発など、現実世界と接続するすべてのAIアプリケーションに革命をもたらす可能性がある。

フェイフェイ・リーとは何者か

フェイフェイ・リーは、AI史上最も影響力のある研究者の一人だ。2009年にスタンフォード大学で公開した画像データセットImageNetは、ディープラーニング革命の起点として知られる。2012年のImageNetコンペティションでジェフリー・ヒントンらのチームが深層学習で圧勝したことが、現在のAIブームの直接的な引き金となった。

経歴詳細
生まれ1976年、中国・北京
学歴プリンストン大学物理学学士、カリフォルニア工科大学博士(電気工学)
スタンフォードコンピュータサイエンス教授、Stanford HAI共同ディレクター
ImageNet2009年発表、1,400万枚以上の分類済み画像データセット
Google2017-2018年、Google Cloud AI/ML担当チーフサイエンティスト
World Labs2023年創業、CEO

彼女がAI業界の「象牙の塔」を離れ、自ら起業した理由は明確だ。「現在のAIはテキストと2D画像の世界に閉じこもっている。しかし人間の知能は本質的に空間的だ」——リーはこの信念のもと、3D世界を理解するAIの開発に乗り出した。

空間知能(Spatial Intelligence)とは何か

空間知能とは、AIが2次元の画像や動画から3次元の物理空間を再構築し、その中で推論・生成・操作ができる能力を指す。現在のLLMが「言語の知能」であるのに対し、空間知能は「物理世界の知能」だ。

従来のAIとの違い

項目従来のLLM / 画像AI空間知能(World Labs)
入力テキスト、2D画像2D画像、動画、点群、テキスト
理解意味的な分類・記述3D構造、奥行き、物理法則
出力テキスト、2D画像3Dシーン、操作指示、シミュレーション
空間認識なし(2D平面上の処理)あり(奥行き・距離・物体関係)
物理法則暗黙的(学習データに依存)明示的にモデル化
応用チャット、画像生成、検索ロボット制御、AR/VR、自動運転

たとえば、1枚の室内写真を空間知能AIに入力すると、以下のことが可能になる。

  1. 3Dシーン再構築: 写真から部屋全体の3Dモデルを生成し、撮影されていない角度からの視点も推定
  2. 物体の認識と配置推論: 椅子、机、本棚などの位置関係を空間グラフとして理解
  3. 物理シミュレーション: 「この棚に本を追加したらどうなるか」を物理法則に基づいて予測
  4. 操作指示の生成: ロボットに「棚から赤い本を取って机に置いて」と指示する際の動作経路を計算

以下の図は、空間知能のアーキテクチャと応用領域の全体像を示しています。

空間知能のアーキテクチャ図。2D入力から空間理解エンジン、3D世界モデル生成、そしてロボティクス・AR/VR・自動運転・ゲームへの応用までのパイプラインを表示

この図が示すとおり、World Labsの基盤モデルは単なる3D画像生成ではなく、空間理解から物理シミュレーション、さらに複数の産業領域への応用までをカバーする包括的なプラットフォームを目指している。

$1B調達の背景——なぜ今、空間AIなのか

調達ラウンドの詳細

World Labsの資金調達の推移を振り返ると、投資家の期待の大きさが見て取れる。

ラウンド時期調達額評価額主要投資家
シード2023年非公開非公開Andreessen Horowitz
Series A2024年後半$230M(約345億円)$5B(約7,500億円)Andreessen Horowitz, NEA, AMD Ventures
新規ラウンド2026年3月$1B(約1,500億円)$5B超(推定)非公開
累計$1.23B+

創業からわずか3年で$1.23Bを調達した計算になる。これはAIスタートアップの中でも異例のスピードだが、背景には3つの要因がある。

要因1: LLMの限界への認識

GPT-4やClaude、Geminiといった大規模言語モデルは、テキスト処理では驚異的な能力を発揮する。しかし、3次元空間の理解は根本的に苦手だ。「机の上にリンゴがあり、その右にコップがある」というテキストは処理できても、実際の空間配置を正確にシミュレーションすることはできない。

ロボティクスや自動運転の発展には、言語だけでなく空間を「見て」「理解して」「操作する」能力が必要だ。World Labsはこのギャップを埋める存在として注目されている。

要因2: ロボティクス市場の急拡大

2025年以降、ヒューマノイドロボットへの投資が爆発的に増加している。Figure AI、Tesla Optimus、1X Technologiesなどが相次いで大型調達を実施し、物理世界で動作するAIの需要が急増している。これらのロボットが実用的に機能するには、高精度な空間認識が不可欠であり、World Labsの技術はその基盤となりうる。

要因3: Apple Vision Pro・Meta Questに代表されるXR市場

AR/VRデバイスの普及が進む中、3D空間をリアルタイムで理解・生成する技術への需要が高まっている。Apple Vision ProやMeta Quest 3は空間コンピューティングを推進しているが、コンテンツ制作のコストと手間が大きな障壁だ。空間知能AIがこの課題を解決する可能性がある。

競合比較——World Labsの立ち位置

3D・空間AI領域にはすでに複数のプレイヤーが存在する。World Labsの競合優位性はどこにあるのか。

企業主力技術累計調達額特徴
World Labs空間知能基盤モデル$1.23B汎用的な3D理解・生成
Runway動画生成AI(Gen-3)$537M2D動画中心、3D対応は限定的
Luma AINeRF / 3Dキャプチャ$180M写真からの3D再構築に特化
Nvidia(Omniverse)産業向け3Dシミュレーション自社資金エンタープライズ寄り
Google(Project Astra)マルチモーダルAIエージェント自社資金空間理解は一部機能

World Labsの最大の差別化要因は、「基盤モデル」としてのアプローチだ。個別のタスク(3D再構築、物体認識など)を別々のモデルで解くのではなく、空間理解全体を一つの大規模モデルで統合的に扱う。これはOpenAIがGPTで言語の基盤モデルを確立したのと同じ戦略であり、成功すれば空間AI分野のプラットフォーマーとなれる。

以下の図は、AI分野別の主要スタートアップの資金調達規模を比較したものです。

AI分野別資金調達マップ。LLM分野(OpenAI $40B+、Anthropic $20B+、xAI $12B)、空間AI分野(World Labs $1.23B、Runway $537M、Luma AI $180M)、ロボティクス分野(Figure AI $750M、Wayve $450M、Skild AI $300M)を棒グラフで比較

この図が示すとおり、LLM分野と比べると空間AI・ロボティクス分野の調達規模はまだ小さい。しかし、World Labsの$1.23Bという数字は空間AI分野では突出しており、同分野のリーダーとしての地位を確立しつつある。

技術的な仕組み——空間基盤モデルの核心

World Labsの技術的な詳細は完全には公開されていないが、公開された論文や発表から、以下のアーキテクチャが推定される。

1. マルチモーダル入力の統合

2D画像、動画、LiDAR点群、テキスト記述など、複数の入力モダリティを統一的なトークン表現に変換する。これにより、「写真1枚から3Dシーンを推測」することも、「テキスト記述から3D空間を生成」することも同一のモデルで処理できる。

2. 3Dシーン表現

従来のNeRF(Neural Radiance Fields)やGaussian Splattingを発展させた独自の3D表現形式を用いている可能性が高い。リアルタイムレンダリングと高精度な物理シミュレーションの両立が鍵だ。

3. 物理法則の組み込み

単に「3Dで見える」だけでなく、重力、摩擦、衝突などの物理法則をモデル内部に組み込む。これにより、「この物体を押したらどう動くか」を正確に予測できる。ロボティクスでの実用には、この物理シミュレーション能力が不可欠だ。

4. エージェント・インタラクション

生成した3D空間内でAIエージェントが行動し、環境と相互作用できるインターフェースを提供する。ロボットの訓練データ生成や、AR空間でのオブジェクト配置などに活用される。

日本への影響——製造業・ロボティクスでの活用可能性

製造業への波及

日本の製造業にとって、空間知能は大きなインパクトを持つ。工場のラインレイアウト最適化、ロボットアームの動作経路計画、品質検査の3D化など、現在は人手やCADに依存している作業がAIで自動化される可能性がある。

特に、中小製造業では3D CADの導入コストが障壁となっているケースが多い。写真からの3Dモデル生成が実用化されれば、高価なCADソフトを使わずとも製品の3Dモデルを作成できるようになる。

ゲーム・映像制作

日本のゲーム産業は世界有数の規模を誇る。3Dアセットの自動生成は、開発コスト削減と制作期間短縮に直結する。テキスト指示から3Dキャラクターや建物を生成できれば、インディーゲーム開発者にとっても大きな恩恵となる。

不動産・建設

不動産の内見をAR/VRで行う動きはすでに始まっているが、空間知能により既存の写真から高品質な3Dウォークスルーを自動生成できれば、コストが大幅に下がる。建設現場の3Dモニタリングにも応用が期待される。

課題と注意点

一方で、日本語・日本の環境に特化した学習データの不足は課題となりうる。日本の住宅、道路、都市構造は欧米とは異なるため、ファインチューニングなしでは精度が出ない可能性がある。国内企業との連携や日本市場向けのローカライゼーションが求められる。

World Labsの今後——IPOの可能性と市場展望

$1.23Bを調達したWorld Labsが次に目指すのは、技術の商用化と市場シェアの確立だ。想定されるマイルストーンは以下の通り。

  1. 2026年中: 開発者向けAPIの一般公開。3Dシーン生成・空間理解機能をSaaSとして提供
  2. 2027年: ロボティクス企業・XRプラットフォームとの大型パートナーシップ
  3. 2028年以降: IPO(新規株式公開)の可能性。評価額$10B超が視野に

フェイフェイ・リーの学術的権威と、$1.23Bという資金力を武器に、World Labsは「空間知能のOpenAI」となれるか。LLMに続くAIの次なるフロンティアとして、空間知能は今後数年で最も注目すべき技術領域の一つだ。

まとめ——次のアクション

  1. 空間知能の動向をウォッチ: World Labs公式サイトやフェイフェイ・リーのSNSをフォローし、API公開のタイミングを把握しておく
  2. 3D技術のスキルアップ: NeRF、Gaussian Splatting、3D Gaussian Splatting(3DGS)などの基礎知識を学んでおくと、空間AIツールが登場した際にすぐに活用できる
  3. 自社業務への適用を検討: 製造業、不動産、ゲーム開発などに携わるなら、「3D空間の理解・生成」が自社のどのプロセスを効率化できるか、今から洗い出しておく

この記事をシェア