L'astuce $dZ$ : factoriser la base commune des gradients

Idée

Tous les calculs de la couche commencent par la même chaîne ; on la nommé une fois et on la réutilise partout.