Transformers1
# Transformers-Part1
Attention is All your Need
最近服务器大量跑计算,正好有时间,把这个非常出名的 Transformers 好好看看,结果就发现他过于抽象,还是归因于自己对于 python 的类、实例、函数认识不清,对于 Torch 还有深度学习基础架构不熟悉。趁这个机会正好好好学习一下。主要就是首先简单记录一下 Transformers 的基础架构,再深入看看基于 Torch 的 Transformers 源码。文中肯定是有纰漏的,有缘人看到请帮忙指正…
# Transformers...
more...