Descente de gradient — la bille dans la cuvette — piège

Piège

La bille suit une trajectoire déterministe dans un potentiel fixe. La 'descente de gradient' implémentée vidéo 5 est full batch (utilise tous les 100 échantillons à chaque itération) : effectivement déterministe. Mais en pratique deep learning, on fait du mini-batch — la 'cuvette' bouge à chaque itération (loss différente sur chaque mini-batch). La trajectoire devient bruitée, plus 'bille dans un brouillard secoué' que 'bille dans cuvette fixe'.