Piège
Le notebook utilise nn.Softmax(dim=0) Cell 9 parce que la convention features-en-lignes mise X en shape (784, N) et la sortie en shape (10, N). La somme doit être faite sur l'axe des classes (dim=0). Avec dim=1, on ferait la somme sur l'axe des exemples — chaque exemple aurait une 'fraction' du total, n'importe quoi. Le dim n'est pas optionnel.