Xe vs He: кого брать-то?

Wait 5 sec.

Xavier vs He: Как правильно 'разогнать' нейросеть перед стартом. Визуализации и эксперименты.Вы ставите Linear(128, 256) в PyTorch. Выбор initializer'а — дело 5 секунд. Но от него зависит, сойдется ли ваша сеть за 10 эпох или не обучится вообще. Че делать-то? Читать далее