ロボティクス16分で読める

NVIDIAがPhysical AI新モデル群を発表——ロボット実世界展開が加速

NVIDIAは、米国のNational Robotics Week(4月4日〜12日)に合わせて、Physical AI(物理AI)分野の新モデル群を一挙に発表した。ワールドモデル「Cosmos 3」、ヒューマノイド向け基盤モデル「Isaac GR00T N1.7」、視覚言語行動モデル「Alpamayo 1.5」の3つが柱だ。さらに、合成データを大規模生成するための「Physical AI Data Factory Blueprint」も公開された。

これらを組み合わせることで、ロボットの開発サイクルが劇的に短縮される。仮想環境で数百万回のシミュレーションを回し、学習済みモデルを実世界のロボットに転移する——いわゆる「Sim-to-Real」パイプラインの完成度が一段と高まった形だ。本記事では、各モデルの技術的特徴、産業応用事例、そして日本のロボティクス産業への影響を詳しく解説する。

Physical AIとは何か

Physical AIは、NVIDIAが提唱する概念で、「物理世界を理解し、その中で行動できるAI」を指す。従来のAI(テキスト生成、画像認識など)が主にデジタル空間で完結するのに対し、Physical AIは実世界の物理法則——重力、摩擦、衝突、変形——を理解した上で、ロボットの行動を計画・実行する。

NVIDIAのJensen Huang CEOは2025年のGTCで「AIの次のフロンティアはPhysical AIだ」と宣言していた。今回の発表は、その構想が具体的な製品群として結実したものと位置づけられる。

Physical AIの3つの柱

以下の図は、NVIDIAが発表したPhysical AIの3つの柱と、それぞれの主要モデルを示しています。

NVIDIA Physical AIの3つの柱。高度なロボット学習(GR00T N1.7、Alpamayo 1.5)、高精度シミュレーション(Omniverse、Data Factory)、基盤モデル(Cosmos 3)

主要モデル/ツール役割
高度なロボット学習Isaac GR00T N1.7、Alpamayo 1.5ロボットが新しいタスクを学習する能力
高精度シミュレーションOmniverse、Isaac Sim、Data Factory物理忠実な仮想環境でのデータ生成と訓練
基盤モデルCosmos 3物理世界の挙動を理解・予測する世界モデル

新モデル詳細解説

Cosmos 3: 物理世界を理解するワールドモデル

Cosmos 3は、NVIDIAが開発したワールドモデル(World Foundation Model)の第3世代だ。ワールドモデルとは、動画や3Dデータから物理世界の挙動パターンを学習し、「次に何が起きるか」を予測できるAIモデルを指す。

Cosmos 3の主な進化点は以下の通り。

  • 物理シミュレーション精度の向上: 布、液体、粒状体(砂、穀物)などの複雑な物質の挙動をより正確に予測。前世代のCosmos 2比で物理忠実度が約40%向上
  • 長時間推論: 30秒以上の動作シーケンスを一貫性を保ったまま予測。ロボットが複数ステップの作業(例: 棚から物を取り、箱に詰め、蓋を閉める)を計画する際に有用
  • マルチモーダル入力: テキスト指示、画像、点群データ、力覚センサーデータなど、多様なセンサー入力を統合して世界の状態を推定

Cosmos 3はオープンウェイトで公開される予定で、研究者やスタートアップが自社のロボットシステムに組み込める。

Isaac GR00T N1.7: ヒューマノイド向け基盤モデル

GR00T(Generalist Robot 00 Technology)は、NVIDIAがヒューマノイドロボット向けに開発している基盤モデルだ。N1.7はその最新バージョンで、前版(N1.5)から大幅な性能向上を実現した。

GR00T N1.7の特徴は以下の通り。

  • 全身協調制御: 上半身と下半身の動作を統合的に制御。歩行しながら両手で物を持つといった複合動作が、単一のモデルで実現可能に
  • 強化学習ベースの適応: 新しい環境(段差、傾斜、滑りやすい床面)に数分で適応する能力。従来は環境ごとに数時間のファインチューニングが必要だった
  • 自然言語指示への対応: 「テーブルの上の赤いカップを持ってきて」のような自然言語指示を理解し、タスクに分解して実行する能力を強化
  • オープンソース公開: Apache 2.0ライセンスでGitHubに公開。ヒューマノイドロボット開発者は自由に利用・改変可能

Alpamayo 1.5: 視覚言語行動モデル

Alpamayoは、視覚情報と言語指示を統合してロボットの行動を生成するVLA(Vision-Language-Action)モデルだ。名前はペルーのアンデス山脈にある美しい山に由来する。

Alpamayo 1.5では、以下の改善が施された。

  • 操作精度の向上: ミリメートル単位の精密なマニピュレーション(ネジ締め、コネクタ挿入など)に対応。前版比でタスク成功率が25%向上
  • ゼロショット汎化: 訓練データに含まれない物体や配置に対しても、高い確率でタスクを遂行。例えば、訓練時にない新しい形状のボトルを開けるタスクに85%の成功率を達成
  • リアルタイム推論: 30FPSでの行動生成が可能。従来の10FPSから3倍に高速化し、動的な環境(コンベアベルト上の物体の把持など)にも対応

Physical AI Data Factory Blueprint

今回の発表で実用面のインパクトが最も大きいのが、Data Factory Blueprintだ。これは、合成データを大規模に生成するためのリファレンスアーキテクチャで、以下の要素で構成される。

コンポーネント機能
Omniverse Replicator3Dシーンの自動生成と画像レンダリング
Isaac Sim物理シミュレーションの実行
Cosmos 3物理的に妥当な動画データの生成
Domain Randomization Engine照明、テクスチャ、物体配置のランダム化
Quality Assurance Pipeline生成データの品質自動検査

従来、ロボットのAI学習には実世界でのデータ収集が不可欠で、これが開発のボトルネックだった。1つの操作タスク(例: ドアの開閉)の学習に必要なデータ収集に、実世界では数週間かかることがある。Data Factory Blueprintを使えば、同等のデータを数時間で合成生成できる。

NVIDIAの試算では、ロボットの新タスク学習にかかる時間が従来比で10〜100分の1に短縮されるという。

仮想から実世界への開発パイプライン

以下の図は、Physical AIのロボット開発パイプライン全体像を示しています。仮想環境でのトレーニングから実世界デプロイまで4つのステップで構成されます。

Physical AIロボット開発パイプライン。データ収集→シミュレーション→モデル学習→実世界デプロイの4ステップと、実世界データによるフィードバックループ

このパイプラインの最大の利点は、実世界での試行錯誤コストを大幅に削減できる点だ。従来のロボット開発では、実機でのテスト中に高価なハードウェアを破損するリスクがあった。仮想環境で十分にテストしてから実機に移行することで、開発コストとリスクの両方を低減できる。

産業応用事例

NVIDIAは今回の発表に合わせて、複数の産業での導入事例を紹介した。

農業: Aigenの太陽光発電ロボット

Aigen社は、太陽光パネルで自律稼働する農業ロボットを開発している。Isaac SimとCosmos 3で訓練したモデルにより、雑草の識別精度が従来比で35%向上。農薬使用量の削減と収穫量の最適化を同時に実現している。同社のロボットは米国中西部の穀物農家を中心に500台以上が稼働中だ。

製造業: BMW・Foxconnでの導入

BMWのスパータンバーグ工場では、GR00T N1.7をベースにしたロボットアームが車体の塗装品質検査を自動化している。従来の画像認識では検出困難だった微細な塗装ムラを、Physical AIの物理モデルと組み合わせることで検出率が92%から99.2%に向上した。

Foxconn(鴻海精密工業)は、iPhoneの組み立てラインにAlpamayo 1.5ベースの精密マニピュレーションシステムを試験導入。コネクタ挿入やネジ締めといった微細作業の自動化を進めている。

エネルギー: プラント点検

Shell(シェル)とBPは、海上石油プラットフォームの点検にPhysical AIベースのドローンとクローラーロボットを導入。Isaac Simで訓練されたロボットが、腐食、亀裂、漏洩の兆候を自律的に検査する。危険な環境での人間の作業を代替することで、安全性と効率性の両方を向上させている。

競合との比較

Physical AI・ロボティクスAI分野では、NVIDIA以外にも有力プレイヤーが存在する。

企業主要製品/技術強み弱み
NVIDIACosmos 3、GR00T、Isaac Simエコシステムの圧倒的な統合力ハードウェア依存(GPU必須)
Google DeepMindRT-2、Gemini Robotics大規模モデルの研究力商用展開の遅さ
Tesla(Optimus)Tesla Bot実世界データの収集力ソフトウェアの外部提供なし
Boston DynamicsAtlas、Spot歩行・バランス制御の成熟度AI統合の後発
Figure AIFigure 02$2.6Bの豊富な資金量産実績なし
Agility RoboticsDigitAmazon倉庫での実運用経験汎用性に課題

NVIDIAの強みは、「モデル(Cosmos、GR00T)」「シミュレーション(Isaac Sim、Omniverse)」「ハードウェア(Jetson Thor)」の3レイヤーを垂直統合している点だ。ロボット開発者は、NVIDIAのエコシステムに乗れば、一気通貫で開発からデプロイまで完結できる。

一方で、NVIDIAのGPU(Jetson ThorやDGX)が必須という点は、コスト面でのハードルになる。特に中小のロボットスタートアップにとっては、初期投資が大きい。

日本のロボティクス産業への影響

日本の現在地

日本は産業用ロボットの分野では世界トップクラスだ。ファナック、安川電機、川崎重工、デンソーウェーブといった企業が、溶接・塗装・組立の自動化で圧倒的なシェアを持っている。しかし、AI駆動のロボティクス——特にヒューマノイドやPhysical AIの分野では、米国勢に大きく遅れをとっている。

チャンスと課題

NVIDIAがGR00T N1.7をオープンソースで公開したことは、日本の企業にとってチャンスだ。自社で基盤モデルをゼロから開発する必要はなく、NVIDIAのモデルをベースにファインチューニングすることで、比較的短期間でAIロボティクスに参入できる。

具体的には以下のような活用が考えられる。

活用シナリオ対象企業期待効果
工場の多品種少量生産への適応ファナック、安川電機段取り替え時間の大幅削減
食品製造の自動化不二精機、MUJIN柔らかい食材のハンドリング改善
建設現場の自動化コマツ、大林組危険作業の代替
介護ロボットCYBERDYNE、パナソニック移乗介助の自動化
農業ロボットクボタ、ヤンマー収穫・除草の自動化

ただし、課題も大きい。NVIDIAのエコシステムへの依存度が高まることで、ソフトウェア基盤を米国企業に握られるリスクがある。また、Jetson Thorなどの専用ハードウェアのコスト(1台あたり数十万円〜数百万円)は、日本の中小製造業にとっては導入障壁になりうる。

日本発の対抗軸

Preferred Networks(PFN)は、NVIDIAとは異なるアプローチでロボティクスAIに取り組んでいる。自社開発のMN-Coreチップ(消費電力あたりの演算性能で世界トップクラス)を活用し、エッジでのリアルタイム推論に特化したロボティクスプラットフォームを構築中だ。

また、ソニーの「Toio」プラットフォームや、トヨタ・リサーチ・インスティテュートの「T-RT2」といった独自の取り組みも進んでいる。ただし、NVIDIAの垂直統合エコシステムの規模には及ばないのが現状だ。

今後のロードマップ

NVIDIAは今回の発表の中で、Physical AIの今後のロードマップも示唆した。

時期マイルストーン
2026年Q2Cosmos 3のオープンウェイト公開
2026年Q3Jetson Thor量産開始
2026年Q4GR00T N2.0(次世代ヒューマノイドモデル)
2027年100社以上でのPhysical AI商用導入

特にJetson Thorの量産開始は重要だ。これはロボット専用のAIコンピュータで、ARM CPU + GPU + DLA(Deep Learning Accelerator)を1チップに統合している。消費電力100W未満でGR00T N1.7のリアルタイム推論を実行でき、ヒューマノイドロボットへの組み込みに最適化されている。

まとめ

NVIDIAの今回の発表は、Physical AIが「研究段階」から「産業実装段階」に移行したことを明確に示すものだ。Cosmos 3、GR00T N1.7、Alpamayo 1.5、Data Factory Blueprintという4つのピースが揃ったことで、ロボットの開発サイクルは従来の数カ月から数週間へと短縮される可能性がある。

アクションステップ

  1. GR00T N1.7のオープンソースをチェック: ヒューマノイドロボットやマニピュレーション研究に関わる開発者は、GitHubでGR00T N1.7のコードとモデルウェイトを確認する。Apache 2.0ライセンスのため、商用利用も可能
  2. Isaac Simの試用: NVIDIAのIsaac Simは無料で利用可能。自社のロボットの3Dモデルをインポートし、仮想環境でのシミュレーションを試す。Data Factory Blueprintを使えば、合成データの大量生成も体験できる
  3. 産業応用の検討: 自社の製造ライン、倉庫、農場などで「Physical AIで自動化できるタスク」を洗い出す。特に「危険」「単調」「人手不足」の3要素が揃うタスクは、Physical AI導入の第一候補になる。NVIDIAのパートナー企業(日本ではソフトバンク、PFNなど)に相談するのも有効だ

この記事をシェア