ロボット学習ベンチマーク

ロボット操作の標準化された評価 — RLBench、LIBERO、CALVIN など。 成功率、タスクの完了、評価指標。

推奨されるモデルとデータセット

比較可能な指標

ベンチマークは、同一のパフォーマンスをチェックするためにグループ化されています。

リアル対シムのカバレッジ

制御された設定と展開指向の設定の両方を評価します。

モデルマッピング

各ベンチマーク パスは互換性のあるモデル ファミリにリンクしています。

実行サポート

必要に応じて、データのキャプチャと評価の操作をサポートします。

ベンチマークの評価やデータが必要ですか?

データ収集と実世界評価のサポートを提供します。