Une couche de neurones — plusieurs détecteurs en parallèle

Idée

Quand plusieurs neurones reçoivent les mêmes entrées sans se parler, chacun calculé son propre score à partir des mêmes données.

Pourquoi

Quand plusieurs neurones reçoivent les mêmes entrées sans se parler, on appelle ça une couche : chacun calculé son propre score à partir des mêmes données, avec ses propres poids et son propre biais. C'est le même geste que résoudre plusieurs équations linéaires en parallèle, sauf que chaque équation est suivie d'un passage dans une fonction sigmoïde. Plus on en met dans la couche, plus le détail captable est fin, mais plus l'entraînement traîne.

Outil

C'est plusieurs équations linéaires affines en parallèle, comme un système où chaque ligne donné une combinaison différente des $x_i$.

Formule

Vers le résumé final, le présentateur fixe la convention pour les indices des poids. Sans regarder, donner la signification de $w_{ij}$.

Piège

Dans une couche, chaque neurone calculé indépendamment $z_i = w_i \cdot x + b_i$. Pas d'échange latéral. La 'communication' ne se fait qu'entre couches : la sortie de tous les neurones de la couche L devient entrée de la couche L+1. Modèle : couches en série, neurones en parallèle dans une couche.