CLIP

  • 2021年に登場。
  • 大量の画像・説明文ペアで学習することでゼロショット画像分類ができる。
  • CLIPは画像とテキストというモードの異なる情報を意味的な近さによって結びつけることを可能にした。
  • CLIPを教師のように使用しテキストから画像を生成するモデルを訓練することも可能。DALL・Eがその最初の例。