Rhoda AIが$4.5億調達——動画学習でロボに知能を与える

ロボティクスAIスタートアップのRhoda AIが、ステルスモードから突如登場し、シリーズAで**4億5,000万ドル（約675億円）の資金調達を完了しました。Bloombergの報道によると、企業評価額は17億ドル（約2,550億円）**に達しています。インドの大手投資ファンドPremji Investがリード投資家を務め、ロボティクスAI分野への巨額投資が続く中でも群を抜く規模です。

Rhoda AIの最大の特徴は、ロボットのハードウェアではなく**「知能」そのもの**を構築している点にあります。数億本のインターネット動画から物理世界の法則を学習する「FutureVision」プラットフォームは、ロボティクスAIの開発パラダイムを根本から変える可能性を秘めています。

FutureVisionとは何か - 動画から物理世界を理解するAI

Rhoda AIが開発する「FutureVision」は、ロボティクス向けの基盤モデル（ファウンデーションモデル）プラットフォームです。従来のロボットAIが「特定のロボットに特定の動作を教え込む」方式だったのに対し、FutureVisionはまったく異なるアプローチを採用しています。

その核心はインターネット上の動画を活用した事前学習です。YouTube、産業用途の動画データベース、研究機関の公開データセットなどから収集した数億本の動画を解析し、以下の知識をモデルに獲得させます。

物理法則の暗黙的理解: 物体の落下、衝突、摩擦、流体の動きなどの物理現象
動作パターンの汎化: 人間がモノを掴む、運ぶ、組み立てるといった動作の一般的なパターン
環境認識能力: 空間内のオブジェクト配置、障害物の回避、作業空間の把握
因果関係の推論: 「Aの操作をするとBの結果が生じる」という因果連鎖の理解

以下の図は、FutureVisionの学習パイプラインの全体像を示しています。

FutureVisionの学習パイプライン - インターネット動画の収集から前処理、事前学習、ファインチューニングを経てロボット制御APIとして出力されるまでの流れ

このアプローチの革新性は、データ収集のスケーラビリティにあります。従来の方式ではロボット1台ごとに何千時間もの実機データを収集する必要がありましたが、FutureVisionはインターネット上に既に存在する膨大な動画データを活用するため、データ量を桁違いに増やせます。これはまさに、大規模言語モデル（LLM）がインターネット上のテキストから言語を学習したのと同じ発想をロボティクスに持ち込んだものです。

事前学習済みのモデルは、特定のロボットや用途に合わせて少量のデータでファインチューニングするだけで高い精度を発揮します。ClaudeのようなLLMが少量の指示で多様なタスクに対応できるのと同様の原理です。

なぜ「ソフトウェア特化」なのか - Figure AIやBoston Dynamicsとの違い

ロボティクスAI業界では、Figure AIやBoston Dynamicsなどハードウェアとソフトウェアを一体開発する企業が注目を集めてきました。しかしRhoda AIは意図的にソフトウェア（知能プラットフォーム）に特化する戦略を選択しています。

この「ソフトウェア特化」の意味は大きく2つあります。

1. ハードウェア非依存のスケーラビリティ: FutureVisionは特定のロボットメーカーに縛られません。産業用アーム、移動ロボット、ヒューマノイドなど、さまざまなハードウェアに「知能」を提供できます。これはOSやクラウドプラットフォームのビジネスモデルに近く、ロボットが普及すればするほど市場が拡大します。

2. 資本効率の高さ: ハードウェア開発には製造設備、サプライチェーン管理、品質保証など膨大な固定費がかかります。ソフトウェアに特化することで、調達した資金の大部分をモデルの研究開発とGPU計算資源に投下できます。実際、Rhoda AIはAWSやGoogle Cloudの大規模GPUクラスタを活用してモデルの訓練を行っていると報じられています。

資金調達で見るロボティクスAIの熱狂

Rhoda AIの$4.5億調達は、ロボティクスAI分野への投資熱を象徴しています。以下のグラフで主要企業の調達額を比較します。

ロボティクスAI企業の資金調達額比較 - AMI Labs $10.3億、Figure AI $6.75億、Rhoda AI $4.5億、Physical Intelligence $4億、Skild AI $3億

特に注目すべきは、Yann LeCun（MetaのチーフAIサイエンティスト）が関わるAMI Labsが累計**10.3億ドル（約1,545億円）**を調達している点です。AMI Labsも「世界モデル」と呼ばれる物理世界の理解を目指すAIを開発しており、Rhoda AIのFutureVisionとはアプローチが異なるものの、目指す方向性には共通点があります。

企業	調達額	評価額	アプローチ	主な強み
AMI Labs	$10.3億	非公開	世界モデル	Yann LeCun、学術的基盤
Figure AI	$6.75億	$26億	ハードウェア+ソフトウェア一体	ヒューマノイドロボット
Rhoda AI	$4.5億	$17億	ソフトウェア特化	動画事前学習、FutureVision
Physical Intelligence	$4.0億	$24億	汎用ロボットAI	Jeff Dean出身メンバー
Skild AI	$3.0億	$15億	スケーラブル基盤モデル	CMU発、多様なロボット対応
Boston Dynamics	非公開	Hyundai傘下	ハードウェア主導	歩行・走行ロボットの実績

Rhoda AIがシリーズAでこれだけの金額を調達できた背景には、動画ベースの事前学習という明確な技術的差別化と、ソフトウェアプラットフォームというスケーラブルなビジネスモデルの組み合わせがあります。

技術的に見たRhoda AIのポジション

FutureVisionの技術的な位置づけを理解するために、ロボティクスAIの主要なアプローチを整理します。

強化学習ベース（従来型）: シミュレーション環境でロボットに試行錯誤させて最適な動作を学習させる方式。高い精度を実現できますが、シミュレーションと現実のギャップ（sim-to-real gap）が課題です。

模倣学習ベース: 人間のデモンストレーションを模倣して学習する方式。直感的ですが、大量のデモデータが必要で、新しいタスクへの汎化が難しいという限界があります。

動画事前学習ベース（Rhoda AI）: インターネット動画から物理世界の一般的な知識を獲得し、個別タスクにはファインチューニングで対応。LLMの成功パターンをロボティクスに応用した最新のアプローチです。

Rhoda AIの主張する利点は、事前学習によってゼロショット・少数ショットでの新タスク対応が可能になることです。例えば、工場の新しい組立工程に対して、従来は数週間かかっていた学習期間を数時間に短縮できるとしています。ただし、この性能についてはまだ独立したベンチマーク検証は行われておらず、今後の実証結果を注視する必要があります。

日本の製造業・物流業にとっての意味

Rhoda AIのようなロボティクスAIプラットフォームは、日本にとって特別な意味を持ちます。その理由は明確です。

深刻な労働力不足: 日本の製造業就業者数は2002年の1,202万人から2022年には1,044万人へと約13%減少（総務省統計局）。物流業界では2024年問題に続き、ドライバー不足が常態化しています。

自動化の遅れ: 日本は産業用ロボット導入数で世界トップクラスですが、その多くは事前にプログラムされた定型作業を行う従来型ロボットです。変化する環境に柔軟に対応できる「知能を持ったロボット」の導入は遅れています。

中小企業の課題: 日本の製造業の99%以上を占める中小企業では、ロボット導入のための技術者確保が困難です。FutureVisionのような「知能プラットフォーム」は、専門知識がなくてもロボットに新しいタスクを教えられる可能性を示しています。

具体的な活用シナリオとしては以下が考えられます。

食品工場の盛り付け作業: 形状が不定形な食材の配置は従来のロボットが苦手とする領域。動画学習による柔軟な物体認識が活きる
物流倉庫のピッキング: 多品種の商品を認識・把持するタスクで、事前学習の汎化能力が効果を発揮
建設現場の資材運搬: 非構造化環境での自律移動と作業、安全判断が求められる領域

一方で課題もあります。日本の製造現場は独自の品質管理基準（カイゼン文化）を持っており、AIプラットフォームがこうした暗黙知をどこまで取り込めるかは未知数です。また、インターネット動画で学習した知識が日本特有の製造プロセスにどれだけ適用できるかも検証が必要です。

料金体系と導入の見通し

Rhoda AIはまだ正式な料金体系を公表していませんが、SaaS型のサブスクリプションモデルを想定していると報じられています。ロボティクスAIプラットフォームの一般的な価格帯から推測すると、以下のような構成になる可能性があります。

API利用料: ロボット1台あたり月額数百〜数千ドル（推定）
ファインチューニング費用: GPU計算コストに基づく従量課金
エンタープライズ契約: 大規模導入時のカスタム料金

クラウドインフラにはAWSやGoogle Cloudが利用されるため、既にこれらのクラウドを利用している企業にとっては導入のハードルが低くなります。

商用サービスの提供開始は2026年後半から2027年にかけてと見られ、まずは北米・欧州市場が対象になると予想されます。日本市場への展開時期は未定ですが、日本の製造業の規模を考えると、早期にアジア展開が検討される可能性は高いでしょう。

まとめ - 今後のアクションステップ

Rhoda AIの登場は、ロボティクスAIが「ハードウェア競争」から「知能プラットフォーム競争」へとシフトしていることを明確に示しています。日本の企業が今からできることを整理します。

情報収集を始める: Rhoda AI、AMI Labs、Physical Intelligenceなど主要プレイヤーの動向をウォッチリストに追加し、技術ブログやカンファレンス発表をフォローする
自社の自動化ニーズを棚卸しする: 現在人手に頼っている作業のうち、AIロボットで代替可能なタスクを洗い出す。特に「変化する環境での非定型作業」がRhoda AIのようなプラットフォームの得意領域
クラウドインフラを整備する: ロボティクスAIの活用にはAWSやGoogle CloudのGPUインスタンスが必要になる。ClaudeなどのAIツールで社内のAIリテラシーを高めておくことも有効
パイロットプロジェクトの計画を立てる: 商用サービス開始時にすぐに試せるよう、小規模なPoC（概念実証）の対象領域とKPIを事前に定義しておく

ロボティクスAIの進化速度は加速しています。ハードウェアの進化を待つだけでなく、「知能プラットフォーム」という新しいレイヤーに早期から注目することが、日本の製造業・物流業の競争力維持につながるはずです。

Rhoda AIが$4.5億調達——動画学習でロボに知能を与える

FutureVisionとは何か - 動画から物理世界を理解するAI

なぜ「ソフトウェア特化」なのか - Figure AIやBoston Dynamicsとの違い

資金調達で見るロボティクスAIの熱狂

技術的に見たRhoda AIのポジション

日本の製造業・物流業にとっての意味

料金体系と導入の見通し

まとめ - 今後のアクションステップ

「AI」カテゴリの記事

あわせて読みたい

関連記事

新着記事