Gato

  • 基盤モデルの1つ。
  • 入力および出力に視覚、言語に加えて数値(連続および離散)にも対応。
  • ロボットハンドの操作も、画像のキャプション作成も、1つのモデルで解くことができる。
  • 言語や資格情報を理解できるロボットの実現に向けた研究。