Dataset booleen — les 4 coins du carre unite

Idée

On remplace les 100 plantes aléatoires par les quatre coins du carre unite et on les etiquette selon une table de verite.

Pourquoi

On remplace les 100 plantes aléatoires de la vidéo par les quatre points $(0,0), (0,1), (1,0), (1,1)$ et on les etiquette selon une table de verite (ET, OU, XOR). C'est un mini-cas d'ecole, exhaustif et lisible a l'oeil nu : on voit tout d'un coup d'oeil, comme on regarde les quatre cas de signes dans un tableau de variations en spé MPSI.

Outil

Mini-cas d'ecole exhaustif, comme les quatre cas de signes dans un tableau de variations en spé MPSI.

Formule

Cell 3 propose 3 lignes pour Y, dont 2 commentées. Sans regarder, dire laquelle est active par défaut.

Piège

Le perceptron entraîné sur les 4 lignes de la table de vérité ET 'apprend' parfaitement... ces 4 points. Comme ces 4 points couvrent EXACTEMENT le domaine d'entrée (toutes les combinaisons booléennes possibles), il n'y a pas de 'généralisation' au sens ML — il n'y a pas de point de test hors domaine. C'est une interpolation, pas une généralisation. La leçon ML standard 'séparer train/test' n'a pas de sens ici.