アーカイブ情報

2025/10/3

【ロボティクス】NVIDIA 、新しいオープン モデルとシミュレーション ライブラリで研究・開発を加速

<「CoRL 2025」 韓国・ソウル、9月29日発>NVIDIAは、オープンソースのNewton Physics Engine が NVIDIA Isaac™ Labでの提供を開始したことを発表した。また、ロボット スキル向けのオープンなNVIDIA Isaac GR00T N1.6リーズニング視覚言語アクション (VLA) モデル、および新しいAIインフラも発表した。これらの技術を組み合わせることで、開発者や研究者には、イテレーションを加速し、テストを標準化し、トレーニングとオンロボットの推論を統合し、ロボットがシミュレーションから現実世界にスキルを安全かつ確実に転送できる、オープンで高速化されたロボティクス プラットフォームを提供する。
 NVIDIAのOmniverseおよびシミュレーション テクノロジ担当バイス プレジデントであるレブ レバレディアン (Rev Lebaredian) 氏は次のように述べている。
 「ヒューマノイドはフィジカルAIの次なるフロンティアであり、予測不可能な世界でリーズニングし、適応し、安全に行動する能力が必要です。今回の最新のアップデートにより、開発者はロボットを研究から日常生活にもたらすための 3 つのコンピューターを手に入れました。Isaac GR00Tはロボットの頭脳となり、Newtonはロボットの身体をシミュレートし、NVIDIA Omniverseはトレーニング場となります」

Newton がロボティクスにおける物理シミュレーションの新たな基準を確立
 ロボットはシミュレーション環境でより高速かつ安全に学習するが、複雑な関節、バランス、動作を持つヒューマノイド ロボットは、現在の物理エンジンを限界まで追い込んでいる。世界中で25万人を超えるロボティクス開発者は、シミュレーションでロボットに教えるスキルが現実世界で安全かつ確実に実行できるように、正確な物理演算を必要としている。
 NVIDIAは、Linux Foundationが管理するオープンソースのGPUアクセラレーテッド物理エンジンであるNewtonのベータ リリースを発表した。Google DeepMind、Disney Research、NVIDIAが共同開発したNewtonは、NVIDIA WarpとOpenUSDフレームワークを基盤に構築されており、現在利用可能。
 Newtonの柔軟な設計と多様な物理ソルバーへの対応により、開発者は雪や砂利の上を歩く動作、カップや果物を扱う動作など、極めて複雑なロボットの動作をシミュレートし、現実世界での展開に成功することが可能になる。
 Newtonを直近で採用している企業や機関には、チューリッヒ工科大学ロボティック システムズ研究室、ミュンヘン工科大学、北京大学などの著名な研究所や大学に加え、ロボティクス企業のLightwheel、シミュレーション エンジン企業であるStyle3Dなどが挙げられる。

Cosmos Reasonが新しいオープンIsaac GR00T N1.6モデルのロボット リーズニングを向上
 物理世界で人間のようなタスクを実行するには、ヒューマノイドが曖昧な指示を理解し、これまで経験したことのない多様かつ稀な事態にも対処する必要がある。間もなく Hugging Faceで提供されるオープンなIsaac GR00T N1.6ロボット基盤モデルの最新リリースには、フィジカルAI向けに構築されたオープンでカスタマイズ可能なリーズニング視覚言語モデルであるNVIDIA Cosmos Reasonが統合される。ロボットの深く思考する脳として機能するCosmos Reasonは、曖昧な指示を段階的な計画に変換し、事前の知識、常識、物理法則を活用して新しい状況に対処し、多くのタスクにわたって一般化する。
 100万回以上ダウンロードされ、現在Hugging FaceでPhysical Reasoning LeaderboardのトップにあるCosmos Reasonは、モデルのトレーニング用の大規模な実データおよび合成データのキュレーションとアノテーション作成も可能。Cosmos Reason 1は、AIモデルの展開向けの使いやすいマイクロサービスであるNIMとして利用可能となった。
 Isaac GR00T N1.6により、ヒューマノイドは移動とオブジェクト操作を同時に行えるようになり、胴体と腕の自由度向上によって重いドアを開けるなどの困難なタスクを完遂できる。
 開発者は、Hugging Faceで公開されているオープンソースのNVIDIA Physical AI Datasetを活用して、Isaac GR00T Nモデルをポスト トレーニングできる。480万回以上ダウンロードされたこのデータセットには、現在、数千の合成および実際の軌跡が含まれている。
 AeiROBOT、Franka Robotics、LG Electronics、Lightwheel、Mentee Robotics、Neura Robotics、Solomon、Techman Robot、UCRなどの主要なロボット メーカーは、汎用ロボットの構築に向けてIsaac GR00T Nモデルを評価している。

フィジカルAI開発のための新しいCosmos World基盤モデル
 NVIDIAは、300万回以上ダウンロードされたオープンなCosmos WFMの新しいアップデートを発表した。これにより、開発者はテキスト、画像、ビデオのプロンプトを活用して多様なデータを生成し、大規模なフィジカルAIモデルのトレーニングを高速化できる。
 間もなくリリースされるCosmos Predict 2.5は、3つのCosmos WFMのパワーを1つの強力なモデルに統合し、複雑性を軽減、時間を節約、効率を向上させる。最大30秒のビデオ生成が可能な長尺ビデオ生成をサポートし、さらにマルチビュー カメラ出力により、より豊富なワールド シミュレーションを実現する。
 間もなく提供されるCosmos Transfer 2.5は、前世代モデルより高速で高品質な結果を実現しつつ、モデル サイズを3.5分の1に縮小した。このモデルは、グラウンド トゥルース3Dシミュレーション シーンおよび深度、セグメンテーション、エッジ、高精細マップなどの空間制御入力から、フォトリアルな合成データを生成できる。

ロボットの把持を指導するための新しいワークフロー
 ロボットに物体を掴むことを教えることは、ロボティクスにおける最も困難な課題の1つ。重要なのは、単に腕を動かすことではなく、思考を正確な行動に変えることであり、ロボットが試行錯誤を重ねて学習しなければならないスキル。
 NVIDIA Omniverse™プラットフォーム上に構築されたIsaac Lab 2.3の開発者プレビューにおける新しい器用な把持ワークフローは、自動化されたカリキュラムを使用して、仮想世界で多指ハンドおよびアーム ロボットをトレーニングする。簡単なタスクから始まり、徐々に複雑さが増していく。ワークフローは、重力、摩擦、物体の重量などの側面を変化させ、予測不可能な環境でもロボットがスキルを学習できるようにトレーニングする。
 Boston DynamicsのAtlasロボットは、このワークフローを活用して把持を学習し、マニピュレーション能力を大幅に向上させた。
 Agility Robotics、Boston Dynamics、Figure AI、Hexagon、Skild AI、Solomon、Techman Robot といった主要なロボット開発企業が、NVIDIA IsaacとOmniverseテクノロジを採用している。

学習済みロボット スキルをシミュレーションで評価
 カップを拾う、部屋を横切って歩くといった新しいスキルをロボットに習得させることは極めて困難であり、実際のロボットでこれらのスキルをテストすることは時間とコストがかかる。
 この解決策は、シミュレーションにある。シミュレーションは、ロボットが学習したスキルを無数のシナリオ、タスク、環境に対してテストする方法を提供する。しかし、シミュレーションにおいても、開発者は断片的で単純化されたテストを構築する傾向があり、それらは現実世界を反映していない。完璧でシンプルなシミュレーションでナビゲーションを学習したロボットは、現実世界の複雑さに直面した瞬間に失敗してしまう。
 開発者がシステムをゼロから構築することなく、シミュレーション環境で複雑な大規模評価を実行できるようにするため、NVIDIAとLightwheelは、スケーラブルな実験と標準化されたテスト向けのオープンソースのポリシー評価フレームワークであるIsaac Lab - Arenaを共同開発している。このフレームワークは間もなく利用可能になる。
NVIDIA の新しい AI インフラがあらゆるところでロボティクス ワークロードを強化
 開発者がこれらの高度なテクノロジとソフトウェア ライブラリを最大限に活用できるようにするため、NVIDIAは最も要求の厳しいワークロード向けに設計されたAIインフラを発表した。これには以下が含まれる。
・NVIDIA GB200 NVL72は、36基のNVIDIA Grace™ CPUと72基のNVIDIA Blackwell GPUを統合したラックスケール システムであり、複雑なリーズニングおよびフィジカル AI タスクを含むAIのトレーニングと推論を高速化するために、主要なクラウド プロバイダーに採用されている。
・NVIDIA RTX PRO™ ーバーは、トレーニング、合成データ生成、ロボット学習、シミュレーションに至るすべてのロボット開発ワークロードに単一のアーキテクチャを提供する。RTX PROサーバーは、RAI Instituteに採用されている。
・Blackwell GPUを搭載したNVIDIA Jetson Thor™は、ロボットがリアルタイムかつインテリジェントなインタラクション向けにマルチAIワークフローを実行することを可能にし、リアルタイムのオンロボット推論を実現する。これは、ヒューマノイド ロボティクスに至る高性能なフィジカルAIワークロードとアプリケーションにおける画期的進歩である。Jetson Thorは、Figure AI、Galbot、Google DeepMind、Mentee Robotics、Meta、Skild AI、Unitreeなどのパートナーに採用されている。

NVIDIA によるロボティクス研究の推進
 GPU、シミュレーション フレームワーク、CUDAアクセラレーテッド ライブラリなどのNVIDIAの技術は、CoRL 2025で採択された論文の半数近くで参照されており、カーネギーメロン大学、ワシントン大学、チューリッヒ工科大学、シンガポール国立大学といった主要な研究所や研究機関で採用されている。
 CoRL 2025ではまた、Stanford Vision and Learning Labによるロボット学習ベンチマーク プロジェクトであるBEHAVIORや、北京大学が開発した視覚ベースの触覚ロボティクスを推進するための高性能シミュレーション プラットフォームであるTaccelも注目を集めている。

カテゴリー
コンバーティングニュース

PAGE TOP