Différence entre le biais d'apprentissage automatique et la variance

4167
852
Elisa Petit

Nous vivons dans un monde où les algorithmes sont partout et beaucoup d'entre nous les utilisent, peut-être même ignorer qu'un algorithme est impliqué. Pour résoudre un problème sur un ordinateur, nous avons besoin d'un algorithme. L'apprentissage automatique dépend d'un certain nombre d'algorithmes pour transformer les ensembles de données en modèles. Les biais et la variance sont les deux concepts fondamentaux de l'apprentissage automatique. Il est important de comprendre les deux en matière de précision dans n'importe quel algorithme d'apprentissage automatique.

Qu'est-ce que le biais?

L'erreur de prédiction pour tout algorithme d'apprentissage automatique peut être divisée en trois parties - erreur de biais, erreur de variance et erreur irréductible. Le biais est un phénomène qui se produit dans le modèle d'apprentissage automatique en raison d'hypothèses incorrectes dans le processus d'apprentissage automatique. Le biais est comme une erreur systématique qui se produit lorsqu'un algorithme produit des résultats systématiquement biaisés en raison de certaines hypothèses incorrectes dans le processus d'apprentissage automatique. Ce sont des hypothèses faites par un modèle pour rendre la fonction cible plus facile à apprendre.

Un biais élevé signifie que l'erreur de formation ainsi que des données de test est plus grande. Il est toujours recommandé qu'un algorithme soit bas biaisé afin d'éviter le problème de la sous-forme. Supposons que vous ayez pris un modèle qui ne peut pas dériver même les modèles essentiels de l'ensemble de données - cela s'appelle sous-instruction. Donc, tout simplement, le biais se produit dans une situation dans laquelle vous avez utilisé un algorithme et il ne correspond pas correctement.

Qu'est-ce que la variance?

La variance est le changement de précision de prédiction de l'apprentissage automatique entre les données de formation et les données de test. Si la variation de l'ensemble de données apporte un changement dans les performances du modèle, il est appelé une erreur de variance. C'est le montant que l'estimation de la fonction cible changera si différentes données de formation étaient utilisées. La fonction cible est supposée à partir des données de formation par un algorithme d'apprentissage automatique, donc une certaine variance dans l'algorithme est attendue.

La variance dépend d'un seul ensemble de formation et il détermine l'incohérence de différentes prévisions en utilisant différents ensembles de formation. La faible variance suggère de petites modifications à l'estimation de la fonction cible avec des modifications apportées à l'ensemble de données de formation, tandis que la grande variance suggère de grandes modifications à l'estimation de la fonction cible avec des modifications de l'ensemble de données de formation. Les algorithmes d'apprentissage automatique à grande variance sont fortement influencés par les spécificités des données de formation.

Différence entre le biais et la variance

Signification

- Le biais est un phénomène qui se produit dans le modèle d'apprentissage automatique dans lequel vous avez utilisé un algorithme et il ne correspond pas correctement. Cela signifie que la fonction utilisée ici est peu pertinente pour le scénario et qu'il n'est pas en mesure d'extraire les modèles corrects. La variance, en revanche, spécifie la quantité de variation que l'estimation de la fonction cible changera si différentes données de formation étaient utilisées. Il dit à quel point une variable aléatoire s'écarte de sa valeur attendue.

Scénario

- Le biais est la différence entre les valeurs prévues et les valeurs réelles. Un faible biais suggère moins d'hypothèses sur la forme de la fonction cible, tandis que un biais élevé suggère plus d'hypothèses sur la forme de la fonction cible. L'instance où le modèle n'est pas en mesure de trouver des modèles dans l'ensemble de formation est appelé sous-instruction. La variance est lorsque le modèle prend en considération les fluctuations des données. Le modèle fonctionne bien sur le test des données et obtient une grande précision mais ne fonctionne pas sur des données nouvelles et invisibles.

Biais d'apprentissage automatique vs. Variance: tableau de comparaison

Biais	Variance
Le biais est un phénomène qui se produit dans le modèle d'apprentissage automatique dans lequel un algorithme est utilisé et ne correspond pas correctement.	La variance spécifie la quantité de variation que l'estimation de la fonction cible changera si différentes données de formation étaient utilisées.
Le biais fait référence à la différence entre les valeurs prédites et les valeurs réelles.	La variance dit à quel point une variable aléatoire s'écarte de sa valeur attendue.
Le modèle ne peut pas trouver de modèles dans l'ensemble de données d'entraînement et échoue pour les données vues et invisibles.	Le modèle trouve la plupart des modèles dans l'ensemble de données et apprend même des données inutiles ou du bruit.

Résumé

Quel que soit le modèle que vous avez, cela devrait être un équilibre parfait entre le biais et la variance. L'objectif de tout algorithme d'apprentissage automatique supervisé est d'obtenir un faible biais et une faible variance. Cependant, ce scénario n'est pas possible car les deux sont inversement connectés les uns aux autres et il est pratiquement impossible d'avoir un modèle d'apprentissage automatique avec un faible biais et une faible variance. Contrairement au biais, la variance est lorsque le modèle prend en compte les fluctuations des données et même le bruit. Si vous essayez de modifier l'algorithme pour mieux s'adapter à un ensemble de données donné, il peut se transformer en un faible biais mais augmentera la variance.

Qu'est-ce que le biais et la variance avec l'exemple?

Le biais de l'apprentissage automatique est un phénomène qui se produit lorsqu'un algorithme est utilisé et qu'il ne correspond pas correctement. Certains exemples de biais comprennent le biais de confirmation, le biais de stabilité et le biais de disponibilité. Les algorithmes ML à faible variance comprennent une régression linéaire, une régression logistique et une analyse discriminante linéaire.

Quels sont les 3 types de biais d'apprentissage automatique?

Trois types de biais sont le biais d'information, le biais de sélection et la confusion.

Comment l'apprentissage automatique peut-il réduire les biais et la variance?

Il est impossible d'avoir un modèle d'apprentissage automatique avec un faible biais et une faible variance. Pour minimiser le biais de l'apprentissage automatique, vous pouvez choisir le modèle d'apprentissage correct ou utiliser le bon ensemble de données de formation.

Quels sont les quatre types de biais dans l'apprentissage automatique?

Quatre types de biais comprennent les biais de sélection, les valeurs aberrantes, les biais de mesure, les biais de rappel, et plus.