LTX-2.3が4K動画+音声を同時生成——OSSで商用利用OKの衝撃
LightricksがLTX-2.3を公開。22Bパラメータで4K・50FPS・音声同時生成のオープンソース動画AIモデル。Apache 2.0で商用利用可能。
LightricksがLTX-2.3を公開。22Bパラメータで4K・50FPS・音声同時生成のオープンソース動画AIモデル。Apache 2.0で商用利用可能。
Google Gemini 3 Deep Thinkが大幅アップグレード。Humanity's Last Exam 48.4%、ARC-AGI-2 84.6%、Codeforces 3455 Eloで推論AI首位。科学研究での活用法を解説。
中国AIスタートアップMiniMaxがマルチモーダルモデルM2.5をリリース。テキスト・画像・音声・動画を統合処理する次世代AIの実力を徹底解説
Alibabaが0.8B〜9Bの4サイズでリリースしたQwen 3.5 Smallファミリー。ネイティブマルチモーダル対応、Apache 2.0ライセンス、GPQA Diamond 81.7の衝撃
Microsoft MAI-Image-2がArena.aiで画像生成AI世界3位に。Copilot統合、DALL-E 3との違い、競合比較を解説。
PitchBookがワールドモデルのゲーム市場を2030年に$276Bと予測。物理環境を理解するAIがゲーム開発を根本から変える仕組みと投資動向を解説。
ImageNet創設者フェイフェイ・リーのWorld Labsが$1B調達。3D空間を理解する「空間知能」AIの技術とロボティクス・AR/VRへの応用を解説。
Adobe Fireflyが動画生成とカスタムモデル機能を追加。著作権クリアなエンタープライズ向け生成AIとしてMidjourney・Runwayとの差別化を解説。
Lightricks LTX 2.3は22BパラメータのDiffusion Transformerで映像と音声を同時生成。4K/50fps対応のオープンソースモデルの技術と競合比較を解説。
Mistral Small 4は119Bパラメータ・128エキスパートのMoEモデルをApache 2.0で公開。推論・マルチモーダル・コーディングを1モデルに統合した革新を解説。
Google Gemini 2.5 Ultraが公開。100万トークンコンテキスト、ネイティブマルチモーダル対応、コーディングでGPT-5超えの実力と料金体系を徹底解説。
DeepSeek V4は1兆パラメータのMoEアーキテクチャとマルチモーダル対応を備えたオープンソースAIモデル。GPT-5やClaude Opus 4.6との比較と日本への影響を解説。