AI先駆者フェイフェイ・リーのWorld Labsが$1B追加調達——「空間知能」で3D世界を理解するAI
ImageNetの生みの親であり、現代のコンピュータビジョン研究を牽引してきたフェイフェイ・リー(李飛飛)。彼女が2023年に創業したWorld Labsが、2026年3月に**$1B(約1,500億円)の新規資金調達を完了した。Series Aで調達した$230Mと合わせ、累計調達額は$1.23B(約1,845億円)**に達する。評価額は$5B(約7,500億円)を超えたとみられ、AI分野でも屈指のユニコーンに成長した。
同社が開発するのは「空間知能(Spatial Intelligence)」と呼ばれる技術だ。テキストや画像を処理する従来のLLMとは異なり、3次元の物理空間を理解し、生成し、操作できるAI基盤モデルを構築している。ロボティクス、AR/VR、自動運転、ゲーム開発など、現実世界と接続するすべてのAIアプリケーションに革命をもたらす可能性がある。
フェイフェイ・リーとは何者か
フェイフェイ・リーは、AI史上最も影響力のある研究者の一人だ。2009年にスタンフォード大学で公開した画像データセットImageNetは、ディープラーニング革命の起点として知られる。2012年のImageNetコンペティションでジェフリー・ヒントンらのチームが深層学習で圧勝したことが、現在のAIブームの直接的な引き金となった。
| 経歴 | 詳細 |
|---|---|
| 生まれ | 1976年、中国・北京 |
| 学歴 | プリンストン大学物理学学士、カリフォルニア工科大学博士(電気工学) |
| スタンフォード | コンピュータサイエンス教授、Stanford HAI共同ディレクター |
| ImageNet | 2009年発表、1,400万枚以上の分類済み画像データセット |
| 2017-2018年、Google Cloud AI/ML担当チーフサイエンティスト | |
| World Labs | 2023年創業、CEO |
彼女がAI業界の「象牙の塔」を離れ、自ら起業した理由は明確だ。「現在のAIはテキストと2D画像の世界に閉じこもっている。しかし人間の知能は本質的に空間的だ」——リーはこの信念のもと、3D世界を理解するAIの開発に乗り出した。
空間知能(Spatial Intelligence)とは何か
空間知能とは、AIが2次元の画像や動画から3次元の物理空間を再構築し、その中で推論・生成・操作ができる能力を指す。現在のLLMが「言語の知能」であるのに対し、空間知能は「物理世界の知能」だ。
従来のAIとの違い
| 項目 | 従来のLLM / 画像AI | 空間知能(World Labs) |
|---|---|---|
| 入力 | テキスト、2D画像 | 2D画像、動画、点群、テキスト |
| 理解 | 意味的な分類・記述 | 3D構造、奥行き、物理法則 |
| 出力 | テキスト、2D画像 | 3Dシーン、操作指示、シミュレーション |
| 空間認識 | なし(2D平面上の処理) | あり(奥行き・距離・物体関係) |
| 物理法則 | 暗黙的(学習データに依存) | 明示的にモデル化 |
| 応用 | チャット、画像生成、検索 | ロボット制御、AR/VR、自動運転 |
たとえば、1枚の室内写真を空間知能AIに入力すると、以下のことが可能になる。
- 3Dシーン再構築: 写真から部屋全体の3Dモデルを生成し、撮影されていない角度からの視点も推定
- 物体の認識と配置推論: 椅子、机、本棚などの位置関係を空間グラフとして理解
- 物理シミュレーション: 「この棚に本を追加したらどうなるか」を物理法則に基づいて予測
- 操作指示の生成: ロボットに「棚から赤い本を取って机に置いて」と指示する際の動作経路を計算
以下の図は、空間知能のアーキテクチャと応用領域の全体像を示しています。
この図が示すとおり、World Labsの基盤モデルは単なる3D画像生成ではなく、空間理解から物理シミュレーション、さらに複数の産業領域への応用までをカバーする包括的なプラットフォームを目指している。
$1B調達の背景——なぜ今、空間AIなのか
調達ラウンドの詳細
World Labsの資金調達の推移を振り返ると、投資家の期待の大きさが見て取れる。
| ラウンド | 時期 | 調達額 | 評価額 | 主要投資家 |
|---|---|---|---|---|
| シード | 2023年 | 非公開 | 非公開 | Andreessen Horowitz |
| Series A | 2024年後半 | $230M(約345億円) | $5B(約7,500億円) | Andreessen Horowitz, NEA, AMD Ventures |
| 新規ラウンド | 2026年3月 | $1B(約1,500億円) | $5B超(推定) | 非公開 |
| 累計 | — | $1.23B+ | — | — |
創業からわずか3年で$1.23Bを調達した計算になる。これはAIスタートアップの中でも異例のスピードだが、背景には3つの要因がある。
要因1: LLMの限界への認識
GPT-4やClaude、Geminiといった大規模言語モデルは、テキスト処理では驚異的な能力を発揮する。しかし、3次元空間の理解は根本的に苦手だ。「机の上にリンゴがあり、その右にコップがある」というテキストは処理できても、実際の空間配置を正確にシミュレーションすることはできない。
ロボティクスや自動運転の発展には、言語だけでなく空間を「見て」「理解して」「操作する」能力が必要だ。World Labsはこのギャップを埋める存在として注目されている。
要因2: ロボティクス市場の急拡大
2025年以降、ヒューマノイドロボットへの投資が爆発的に増加している。Figure AI、Tesla Optimus、1X Technologiesなどが相次いで大型調達を実施し、物理世界で動作するAIの需要が急増している。これらのロボットが実用的に機能するには、高精度な空間認識が不可欠であり、World Labsの技術はその基盤となりうる。
要因3: Apple Vision Pro・Meta Questに代表されるXR市場
AR/VRデバイスの普及が進む中、3D空間をリアルタイムで理解・生成する技術への需要が高まっている。Apple Vision ProやMeta Quest 3は空間コンピューティングを推進しているが、コンテンツ制作のコストと手間が大きな障壁だ。空間知能AIがこの課題を解決する可能性がある。
競合比較——World Labsの立ち位置
3D・空間AI領域にはすでに複数のプレイヤーが存在する。World Labsの競合優位性はどこにあるのか。
| 企業 | 主力技術 | 累計調達額 | 特徴 |
|---|---|---|---|
| World Labs | 空間知能基盤モデル | $1.23B | 汎用的な3D理解・生成 |
| Runway | 動画生成AI(Gen-3) | $537M | 2D動画中心、3D対応は限定的 |
| Luma AI | NeRF / 3Dキャプチャ | $180M | 写真からの3D再構築に特化 |
| Nvidia(Omniverse) | 産業向け3Dシミュレーション | 自社資金 | エンタープライズ寄り |
| Google(Project Astra) | マルチモーダルAIエージェント | 自社資金 | 空間理解は一部機能 |
World Labsの最大の差別化要因は、「基盤モデル」としてのアプローチだ。個別のタスク(3D再構築、物体認識など)を別々のモデルで解くのではなく、空間理解全体を一つの大規模モデルで統合的に扱う。これはOpenAIがGPTで言語の基盤モデルを確立したのと同じ戦略であり、成功すれば空間AI分野のプラットフォーマーとなれる。
以下の図は、AI分野別の主要スタートアップの資金調達規模を比較したものです。
この図が示すとおり、LLM分野と比べると空間AI・ロボティクス分野の調達規模はまだ小さい。しかし、World Labsの$1.23Bという数字は空間AI分野では突出しており、同分野のリーダーとしての地位を確立しつつある。
技術的な仕組み——空間基盤モデルの核心
World Labsの技術的な詳細は完全には公開されていないが、公開された論文や発表から、以下のアーキテクチャが推定される。
1. マルチモーダル入力の統合
2D画像、動画、LiDAR点群、テキスト記述など、複数の入力モダリティを統一的なトークン表現に変換する。これにより、「写真1枚から3Dシーンを推測」することも、「テキスト記述から3D空間を生成」することも同一のモデルで処理できる。
2. 3Dシーン表現
従来のNeRF(Neural Radiance Fields)やGaussian Splattingを発展させた独自の3D表現形式を用いている可能性が高い。リアルタイムレンダリングと高精度な物理シミュレーションの両立が鍵だ。
3. 物理法則の組み込み
単に「3Dで見える」だけでなく、重力、摩擦、衝突などの物理法則をモデル内部に組み込む。これにより、「この物体を押したらどう動くか」を正確に予測できる。ロボティクスでの実用には、この物理シミュレーション能力が不可欠だ。
4. エージェント・インタラクション
生成した3D空間内でAIエージェントが行動し、環境と相互作用できるインターフェースを提供する。ロボットの訓練データ生成や、AR空間でのオブジェクト配置などに活用される。
日本への影響——製造業・ロボティクスでの活用可能性
製造業への波及
日本の製造業にとって、空間知能は大きなインパクトを持つ。工場のラインレイアウト最適化、ロボットアームの動作経路計画、品質検査の3D化など、現在は人手やCADに依存している作業がAIで自動化される可能性がある。
特に、中小製造業では3D CADの導入コストが障壁となっているケースが多い。写真からの3Dモデル生成が実用化されれば、高価なCADソフトを使わずとも製品の3Dモデルを作成できるようになる。
ゲーム・映像制作
日本のゲーム産業は世界有数の規模を誇る。3Dアセットの自動生成は、開発コスト削減と制作期間短縮に直結する。テキスト指示から3Dキャラクターや建物を生成できれば、インディーゲーム開発者にとっても大きな恩恵となる。
不動産・建設
不動産の内見をAR/VRで行う動きはすでに始まっているが、空間知能により既存の写真から高品質な3Dウォークスルーを自動生成できれば、コストが大幅に下がる。建設現場の3Dモニタリングにも応用が期待される。
課題と注意点
一方で、日本語・日本の環境に特化した学習データの不足は課題となりうる。日本の住宅、道路、都市構造は欧米とは異なるため、ファインチューニングなしでは精度が出ない可能性がある。国内企業との連携や日本市場向けのローカライゼーションが求められる。
World Labsの今後——IPOの可能性と市場展望
$1.23Bを調達したWorld Labsが次に目指すのは、技術の商用化と市場シェアの確立だ。想定されるマイルストーンは以下の通り。
- 2026年中: 開発者向けAPIの一般公開。3Dシーン生成・空間理解機能をSaaSとして提供
- 2027年: ロボティクス企業・XRプラットフォームとの大型パートナーシップ
- 2028年以降: IPO(新規株式公開)の可能性。評価額$10B超が視野に
フェイフェイ・リーの学術的権威と、$1.23Bという資金力を武器に、World Labsは「空間知能のOpenAI」となれるか。LLMに続くAIの次なるフロンティアとして、空間知能は今後数年で最も注目すべき技術領域の一つだ。
まとめ——次のアクション
- 空間知能の動向をウォッチ: World Labs公式サイトやフェイフェイ・リーのSNSをフォローし、API公開のタイミングを把握しておく
- 3D技術のスキルアップ: NeRF、Gaussian Splatting、3D Gaussian Splatting(3DGS)などの基礎知識を学んでおくと、空間AIツールが登場した際にすぐに活用できる
- 自社業務への適用を検討: 製造業、不動産、ゲーム開発などに携わるなら、「3D空間の理解・生成」が自社のどのプロセスを効率化できるか、今から洗い出しておく