ロボット学習ベンチマーク

ロボット操作の標準化された評価 — RLBench、LIBERO、CALVIN など。成功率、タスクの完了、評価指標。

コレクション

シミュレーションベンチマークトラック

再現可能なシミュレーションファースト評価のためのタスクスイート。

コレクション

実ロボット評価

ベンチマークは、具体化された展開と堅牢性に焦点を当てました。

コレクション

言語条件付きタスク

指導の基礎とタスクの構成を重視したベンチマーク。

クイックブラウズ

操作のベンチマーク

環境と評価の焦点によってベンチマークスイートをフィルターします。

シミュレーション

RLBベンチ

PyRep には 100 以上の操作タスクがあります。 VLAの評価に広く使用されています。サブセットでは BridgeVLA 88.2%、InternVLA 95%+。

ベンチマークを見る→ シミュレーション

LIBERO

生涯学習のベンチマーク。 130 のタスク、空間/オブジェクト/目標スイート。ロボスイート。 95.9% SOTA (InternVLA)。

ベンチマークを見る→ シミュレーション

CALVIN

言語と視覚から行動を構成する。長期的、言語条件付き。 RoboFlamingo の強力なベースライン。

ベンチマークを見る→ リアルロボット

Google ロボットベンチマーク

現実世界の操作。 700以上のタスク。 WidowX、さまざまな実施形態。成功率、マルチタスクの評価。

ベンチマークを見る→ リアルロボット

COLOSSEUM

大規模な実物ロボットのベンチマーク。多様なタスク、環境。ブリッジVLA 64%。

ベンチマークを見る→

リンクされたアセット

推奨されるモデルとデータセット

比較可能な指標

ベンチマークは、同一のパフォーマンスをチェックするためにグループ化されています。

リアル対シムのカバレッジ

制御された設定と展開指向の設定の両方を評価します。

モデルマッピング

各ベンチマークパスは互換性のあるモデルファミリにリンクしています。

実行サポート

必要に応じて、データのキャプチャと評価の操作をサポートします。

ベンチマークの評価やデータが必要ですか?

データ収集と実世界評価のサポートを提供します。

データサービスお問い合わせ

ロボット学習ベンチマーク

シミュレーションベンチマークトラック

実ロボット評価

言語条件付きタスク

人気のカテゴリ

人気のタグ

操作のベンチマーク

RLBベンチ

LIBERO

CALVIN

Google ロボットベンチマーク

COLOSSEUM

推奨されるモデルとデータセット

比較可能な指標

リアル対シムのカバレッジ

モデルマッピング

実行サポート

ベンチマークの評価やデータが必要ですか?

ロボット学習ベンチマーク

シミュレーション ベンチマーク トラック

実ロボット評価

言語条件付きタスク

人気のカテゴリ

人気のタグ

操作のベンチマーク

RLBベンチ

LIBERO

CALVIN

Google ロボット ベンチマーク

COLOSSEUM

推奨されるモデルとデータセット

比較可能な指標

リアル対シムのカバレッジ

モデルマッピング

実行サポート

ベンチマークの評価やデータが必要ですか?

シミュレーションベンチマークトラック

Google ロボットベンチマーク