BERT Busters: Outlier Dimensions That Disrupt Transformers

Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt

Præsentation
Citationsformater

Olga Kovaleva
Saurabh Kulshreshtha
Rogers, Anna
Anna Rumshisky

Multiple studies have shown that Transformers are remarkably robust to pruning. Contrary to this received wisdom, we demonstrate that pre-trained Transformer encoders are surprisingly fragile to the removal of a very small number of features in the layer outputs ($

Originalsprog	Engelsk
Titel	Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021
Antal sider	14
Udgivelsessted	Online
Forlag	Association for Computational Linguistics (ACL)
Publikationsdato	1 aug. 2021
Sider	3392-3405
DOI	https://doi.org/10.18653/v1/2021.findings-acl.300
Status	Udgivet - 1 aug. 2021

Forskning

BERT Busters: Outlier Dimensions That Disrupt Transformers

Links