Formule
Pour $\partial L / \partial b^{[2]}$, le résultat doit être de dimension $(n_2, 1)$. On part de $dZ^{[2]}$ qui est $(n_2, m)$. Expliquez pourquoi sommer suivant l'axe 1 (les colonnes) est la bonne opération, et faites le lien avec le broadcasting utilisé en forward propagation.