Computational Bottlenecks of Training Small-scale Large Language Models

Published in NeurIPS Workshop on Efficient Natural Language and Speech Processing, 2024