1 再帰型ニューラルネットワークの仕組み
1.1 再帰型ニューラルネットワーク(RNN)
1.2 LSTM
1.3 Seq2seq、Attention Seq2seq
2 Transformerの仕組み
2.1 Transformer
2.2 大規模言語モデル
3 Vision Transformerの仕組み
3.1 特徴表現獲得の変遷
3.2 VIsion Transformer(ViT)
3.3 ViTによる画像認識
3.4 ViTによる特徴表現獲得
3.5 ViTベースの物体検出、セマンティックセグメンテーション
3.6 ViTの自己教師あり学習
4 ViTの最新動向
4.1 ViTの派生手法(Swin Transformer、ConvNeXtなど)
4.2 ViTの派生手法の傾向
5 TransformerによるBEV Perception
5.1 Bird’s-Eye-View(BEV)空間
5.2 BEVベースの3D物体検出:BEVFormer, BeVerse
5.3 BEVベースの自動運転:UniAD