私たちのアプローチ
人間中心の物理AI。 私たちは、ロボット学習を実際にスケールさせるデータ ループに焦点を当てています。最大のプラットフォームではありませんが、チームが置き換えることのできないプラットフォームです。
私たちが最適化する閉ループ
データループ
ロボット学習における中心的な課題はモデルのサイズではなく、 データ。 それはどこから来て、どのようにして使えるようになるのか、そしてさまざまなソースがどのように組み合わされるのか。 私たちは、現実世界での失敗を次のトレーニング ラウンドに変える閉ループを構築します。
実際のエピソード → 構造化されたパケット → ベンチマークの実行 → 失敗のリプレイ → トレーニングに戻る。
クライアントが失敗ログをアップロードし、自動再生レポートとベンチマーク レポートを取得し、当社のシステムを通じてポリシー A/B テストを実行すると、クライアントはそれに依存し始めます。 それがお堀です。
私たちが測定するもの
私たちの北極星は、コードの量やモデルのサイズではありません。 それは次の 5 つの数字です。
- 新しいロボットのオンボーディング時間 — 新しいプラットフォームはどれくらいの速度で接続できますか?
- 新しいタスクを最初のベースラインに追加 — デモから実行可能なポリシーへ
- 単一障害の再トレーニング時間 — 失敗してもどれくらい早く次のトレーニングラウンドに再参加できますか?
- 自動評価範囲 — 意思決定の何パーセントがベンチマークに依存していますか?
- 毎週のクライアント依存性 — 私たちのシステムには、どれくらいの数の継続/中止の決定が流れますか?
統合するデータソース
ロボット トレーニング データは 5 つの主要なパスから取得されます。 単一のソースだけでは十分ではありません — 未来は 異種データの組み合わせ.
- インターネットの人間ビデオ — スケールと以前はありますが、アクション ラベルはありません。 これは、生のモーター コマンドではなく、タスク構造に使用します。
- 合成データ — 自動生成ですが、Sim2Real とのギャップ。 私たちは報酬の設計とドメインのランダム化に重点を置いています。
- モーションキャプチャー — 高精度、ポータブル。 ビデオとロボット実行の間の橋渡しをします。
- ロボット遠隔操作 — ほとんどの導入に合わせて調整されていますが、高価です。 効率と RECAP スタイルの修正フローを最適化します。
- 異種組み合わせ — クロスタスク、クロスロボット、クロスモーダル。 本当のフロンティア。
データ表現は生の量よりも重要です。 エピソードを構造化されたパケットに、失敗をトレーニング可能なケースに、ベンチマークを意思決定面に変換します。
私たちが築く6つの堀
- データモート — ほとんどのデータではありませんが、最も少ないデータ: 実際の失敗、修正、評価履歴、ロボット間の調整。
- 基準堀 — クライアントのゴー/ノーゴーの決定は、ますます当社のベンチマークに依存します。
- アダプター堀 — 新しいロボットと新しい入力デバイスのオンボーディング速度が最大の参入利点となります。
- ワークフローの堀 — 研究、エンジニアリング、テスト、運用はすべて同じ事実を認識します。
- リアルとシムの相関堀 — 私たちのベンチマーク結果は、現実世界のパフォーマンスを予測します。
- 商業関係の堀 — 「このツールを試してください」から「レポートを毎日チェックし、毎週決定します」まで。
豊富な接触と触覚
私たちは以下を専門としています 接触を伴う操作が多い — 挿入、組み立て、力に敏感な作業。 多くのチームはビジョンを行っています。 コンタクトタスクの実際の閉ループはより困難です。 触覚、トルク、力の信号をデータ ループとポリシー トレーニングに統合します。
ロボット学習環境とサービスとしての評価
「サービスとしての RL 環境」を超えて、私たちは次のことを提供します。 Real-to-Sim-to-Real 環境と評価クラウド。 環境は RL を実行するためだけのものではなく、合成データ、ポリシー トレーニング、シミュレートされた評価、障害のリプレイ、ベンチマークの公開のためのものです。 ワールドモデル、環境生成、評価が統一されています。
理想的な状態: クライアントが実際の障害ログをアップロードする → 当社がリプレイとベンチマークを自動生成する → すべてのポリシー変更が最初に当社のシステムを通過する → クライアントが当社の回帰レポートを毎晩チェックする → 時間の経過とともにより多くのロボットとタスクが搭載されます。
そのとき、私たちは「AI を使用するチーム」ではなくなります。 デフォルトのコントロールプレーン クライアントの実世界のロボット反復に。