クラウド15分で読める

クラウド浪費が5年ぶりに増加、29%に——Flexera調査でAIワークロードが元凶と判明

クラウド支出の29%が無駄になっている——IT資産管理大手のFlexeraが2026年3月18日に公開した「2026 State of the Cloud Report」で、衝撃的な数字が明らかになりました。クラウド浪費率が前年の26%から29%へと3ポイント跳ね上がり、5年連続で改善していたトレンドが初めて反転したのです。原因は明白で、AIワークロードの急増にあります。

グローバルクラウド市場が2026年に約**$960B(約144兆円)に迫るなか、29%の浪費は金額にして推定$278B(約42兆円)**に相当します。企業がAI導入を急ぐあまり、GPUインスタンスの過剰プロビジョニングやアイドル状態のリソースが放置され、クラウドコストの最適化が追いつかない状況が浮き彫りになりました。

Flexera 2026 State of Cloudの主要発見

Flexeraの調査は、世界各国の750以上の組織を対象に実施されたもので、クラウド業界で最も引用されるベンチマークレポートの一つです。2026年版の主要な発見は以下のとおりです。

クラウド浪費の実態

  • クラウド支出の**29%**が浪費されていると推定(前年比+3ポイント)
  • 5年ぶりの浪費率上昇で、2021年の32%以来の高水準
  • 浪費増加の主因はAIワークロードの急速な拡大

FinOpsの成熟化

  • 回答組織の**68%**がFinOpsチームを設置済み(前年比+11ポイント)
  • FinOpsの焦点がコスト削減から「ビジネス価値の定量化」へシフト
  • しかしAIワークロードに特化したFinOpsプラクティスを持つ組織はわずか22%

マルチクラウドの加速

  • 回答組織の**89%**がマルチクラウド戦略を採用
  • 平均利用クラウド数は3.4プロバイダー
  • SaaSサプライチェーンがセキュリティ上の最大の懸念事項に浮上

AI関連支出の急増

  • クラウド支出に占めるAI/ML関連の割合が前年比47%増
  • GPU/TPUインスタンスの利用率は平均**38%**にとどまる(一般的なコンピュートインスタンスは65%)

なぜAIワークロードが浪費を生むのか

AIワークロードが従来のクラウドワークロードと決定的に異なるのは、そのリソース消費パターンの不規則性にあります。

GPUインスタンスの過剰プロビジョニング

大規模言語モデル(LLM)のファインチューニングや推論には、NVIDIA A100やH100といった高価なGPUインスタンスが必要です。AWSのp5.48xlargeインスタンス(H100×8基搭載)は1時間あたり**$98.32**、月間フル稼働で**約$71,000(約1,065万円)**に達します。

問題は、多くの組織がAIプロジェクトの初期段階で「念のため大きめに」インスタンスを確保し、そのまま放置しているケースが多いことです。Flexeraの調査によると、AI/MLワークロード向けに確保されたGPUインスタンスの**62%**が、実際のピーク使用率の2倍以上のキャパシティを持っていました。

トレーニングとサービング(推論)のギャップ

AIモデルのライフサイクルには、大量のGPUリソースを消費する「トレーニングフェーズ」と、比較的軽量な「推論フェーズ」があります。トレーニングが完了した後も、トレーニング用に確保したインスタンスがそのまま稼働し続けるケースが少なくありません。

データパイプラインの非効率

AI/MLパイプラインでは、データの前処理、トレーニング、評価、デプロイという複数のステージが存在します。各ステージで異なるリソース要件があるにもかかわらず、パイプライン全体を通じて同一の高スペックインスタンスを使い続ける構成が一般的です。これにより、データ前処理のような比較的軽量な処理にもGPUインスタンスが割り当てられ、浪費が積み重なります。

この図は、2021年から2026年にかけてのクラウド浪費率の推移を示しています。2021年の32%から5年連続で改善が続いていましたが、2026年にAIワークロードの急増を受けて29%に反転上昇しています。

クラウド浪費率の推移(2021〜2026年)— 5年連続の改善トレンドが2026年にAIワークロードの急増で反転

この反転は、企業のクラウド最適化努力が足りなかったというよりも、AIという新しいワークロードカテゴリへの対応が追いついていないことを物語っています。

FinOpsの進化——コスト削減からビジネス価値の可視化へ

Flexeraの調査で注目すべきもう一つのトレンドは、FinOps(クラウドの財務管理)の成熟化です。

従来のFinOpsは「いかにクラウドコストを削減するか」が主題でした。しかし2026年版の調査では、先進的な組織がFinOpsの目的を「クラウド支出あたりのビジネス価値を最大化する」方向にシフトさせていることが明らかになりました。

具体的には、以下のような指標が重視されるようになっています。

  • Revenue per Cloud Dollar: クラウド支出1ドルあたりの売上高
  • Time to Market: クラウドリソースのプロビジョニングからサービス提供までの時間
  • Innovation Rate: 新機能のデプロイ頻度とクラウドコストの相関
  • AI ROI: AI/MLプロジェクトの投資対効果(トレーニングコスト vs 推論による収益貢献)

ただし、この進化にはAIワークロードという新たな壁が立ちはだかっています。従来のFinOpsツールはコンピュート・ストレージ・ネットワークの3軸で最適化を行っていましたが、GPUの利用率やモデルのトレーニング効率といったAI固有の指標に対応できていないケースが大半です。

クラウド3大ベンダーのAIコスト最適化ツール比較

AIワークロードのコスト最適化に向けて、主要クラウドベンダーはそれぞれ専用ツールを提供し始めています。

項目AWSAzureGoogle Cloud
AI専用コスト分析AWS Cost Explorer + SageMaker Cost AllocationAzure AI Cost ManagementGCP Cost Management + Vertex AI Billing
GPU利用率モニタリングCloudWatch GPU MetricsAzure Monitor GPU InsightsCloud Monitoring GPU Metrics
自動スケーリングSageMaker Inference Auto-ScalingAzure ML Managed EndpointsVertex AI Prediction Auto-Scaling
スポット/プリエンプティブルSpot Instances(最大90%割引)Spot VMs(最大80%割引)Spot VMs(最大91%割引)
リザーブド/コミット割引Savings Plans + Reserved InstancesReserved VM InstancesCommitted Use Discounts(CUD)
AI向け推奨アクションCompute Optimizer(GPU対応)Azure Advisor AI RecommendationsActive Assist Recommendations
FinOps統合FOCUS対応FOCUS対応FOCUS対応
月額最小GPU構成p4d.24xlarge: ~$23,000NC24ads_A100: ~$18,000a2-highgpu-1g: ~$7,500

注目すべきは、3社ともFinOps Foundation が策定した**FOCUS(FinOps Cost & Usage Specification)**に対応し始めている点です。これにより、マルチクラウド環境でもコストデータの標準化と横断的な分析が可能になりつつあります。

クラウド市場$1兆時代の課題

グローバルクラウド市場は2026年に**$960B**に達すると予測されており、$1兆の大台が目前に迫っています。しかし市場の拡大に伴い、複雑性も増しています。

この図は、クラウド市場規模の拡大とともに浪費額も増大している実態を示しています。2026年は市場全体が$960Bに達する一方、推定浪費額は$278Bに膨らんでいます。

グローバルクラウド市場規模と浪費額の推移 — 市場拡大とともに浪費額も増大、2026年は推定$278Bが無駄に

マルチクラウドの複雑性

89%の組織がマルチクラウドを採用しているなか、異なるプロバイダー間でのコスト最適化は一層困難になっています。AWSのSavings PlansとGCPのCommitted Use Discountsでは割引モデルが根本的に異なり、組織横断的な最適化戦略の策定には高度な専門知識が求められます。

SaaSサプライチェーンリスク

Flexeraの2026年レポートで新たに取り上げられたのが、SaaSサプライチェーンがサイバー攻撃の主要な侵入経路になっている問題です。平均的な大企業は400以上のSaaSアプリケーションを利用しており、各SaaSベンダーのセキュリティ体制を個別に検証することは現実的に不可能です。AIツールの急速な導入により、未承認のSaaS(シャドーIT)も増加しており、セキュリティとコストの両面でリスクが拡大しています。

ガバナンスの限界

AI時代のクラウドガバナンスでは、従来のタグ管理やリソースグループだけでは不十分です。AIモデルのバージョン管理、データリネージュ(データの出所と変換履歴の追跡)、モデルの推論コストの帰属先管理など、新たなガバナンス要件が次々と浮上しています。

日本企業のクラウドコスト最適化——AI時代の実践戦略

日本のクラウド市場もグローバルトレンドと同様の課題を抱えています。総務省の「情報通信白書」によると、日本のクラウドサービス市場は2025年に約8兆円に達しており、AIワークロード関連の支出が急成長分野です。

日本固有の課題

為替リスク: 主要クラウドサービスはUSD建てで課金されるため、円安局面ではクラウドコストが自動的に膨張します。2026年3月時点で1ドル=約150円ですが、数年前の110円台と比較すると、同じワークロードでも約36%のコスト増を意味します。

リージョン料金の差: AWSやGCPの東京リージョンは、米国リージョンと比較して10〜20%割高に設定されています。レイテンシ要件が厳しくないAIトレーニングのワークロードは、米国リージョンで実行することでコストを抑えられます。

人材不足: FinOpsの実践にはクラウドアーキテクチャ、財務、ビジネスの3つの知識が必要ですが、日本ではこれらを兼ね備えたFinOpsエンジニアが極めて不足しています。

実践的な最適化アプローチ

  1. AIワークロードの可視化を最優先に: まずはAI/ML関連のクラウドリソースにタグを付与し、コストの全体像を把握する。AWSのCost Allocation TagsやSageMakerのコスト配分機能、Google CloudのBilling Labelsを活用する

  2. GPUインスタンスのライトサイジング: 現在のGPU利用率を測定し、50%未満なら小さいインスタンスタイプへの移行を検討する。推論ワークロードにはInference専用インスタンス(AWS Inf2、GCP TPU v5e)の活用も有効

  3. スポットインスタンスの積極活用: AIモデルのトレーニングはチェックポイントを取りながらスポットインスタンスで実行することで、最大90%のコスト削減が可能。中断耐性のあるフレームワーク(PyTorch DistributedやDeepSpeed)を採用する

  4. Committed Use Discountsの戦略的契約: 推論ワークロードなど安定した負荷には1〜3年のコミット契約を活用する。ただしAI分野はGPU世代の更新が速いため、3年契約は慎重に判断すべき

  5. FinOpsチームの組成: 最低でもクラウドエンジニア1名、財務担当1名、ビジネスオーナー1名の3名体制で、月次のコストレビューを実施する

まとめ

Flexeraの2026 State of the Cloud Reportは、AIブームの副作用としてクラウド浪費が再び増加に転じたという重要な警鐘を鳴らしています。

クラウド市場が$1兆に迫る2026年、29%の浪費は**約$278B(42兆円)**という途方もない金額を意味します。しかし裏を返せば、この浪費を最適化できた組織は膨大なコスト削減と競争優位を手にできるということです。

今すぐ取り組むべき3つのアクションステップ:

  1. AI/MLワークロードのコスト可視化: タグ付けとモニタリングを今週中に開始し、現状の浪費率を定量的に把握する
  2. GPU利用率の測定と最適化: 利用率50%未満のGPUインスタンスを特定し、ライトサイジングまたはスポットインスタンスへの移行計画を策定する
  3. FinOps体制の構築: AI時代のFinOpsプラクティスを導入し、コスト削減だけでなく「クラウド支出あたりのビジネス価値」を定期的に測定する仕組みを整える

AIの活用を加速しながらも、無駄なコストを削減する——この両立こそが、2026年のクラウド戦略において最も重要なテーマです。

この記事をシェア