ロボット学習ベンチマーク
ロボット操作の標準化された評価 — RLBench、LIBERO、CALVIN など。 成功率、タスクの完了、評価指標。
クイックブラウズ
人気のカテゴリ
高速タグ
人気のタグ
評価
操作のベンチマーク
シミュレーション
RLBベンチ
PyRep には 100 以上の操作タスクがあります。 VLAの評価に広く使用されています。 サブセットでは BridgeVLA 88.2%、InternVLA 95%+。
ベンチマークを見る→ シミュレーションLIBERO
生涯学習のベンチマーク。 130 のタスク、空間/オブジェクト/目標スイート。 ロボスイート。 95.9% SOTA (InternVLA)。
ベンチマークを見る→ シミュレーションCALVIN
言語と視覚から行動を構成する。 長期的、言語条件付き。 RoboFlamingo の強力なベースライン。
ベンチマークを見る→ リアルロボットGoogle ロボット ベンチマーク
現実世界の操作。 700以上のタスク。 WidowX、さまざまな実施形態。 成功率、マルチタスクの評価。
ベンチマークを見る→ リアルロボットCOLOSSEUM
大規模な実物ロボットのベンチマーク。 多様なタスク、環境。 ブリッジVLA 64%。
ベンチマークを見る→
リンクされたアセット
推奨されるモデルとデータセット
比較可能な指標
ベンチマークは、同一のパフォーマンスをチェックするためにグループ化されています。
リアル対シムのカバレッジ
制御された設定と展開指向の設定の両方を評価します。
モデルマッピング
各ベンチマーク パスは互換性のあるモデル ファミリにリンクしています。
実行サポート
必要に応じて、データのキャプチャと評価の操作をサポートします。