ICLR 2020 | 抛开卷积,multi-head self-attention能够表达任何卷积操作

NoSuchKey