Bienvenu dans le biais d’oubli de la fréquence de base.
Rappel du problème :
Dans un pays de 1 million d’habitants.
100 habitants ont le COVID-19.
On développe une application pour les repérer.
Mais cette application à une marge d’erreur de 1% (ou plutôt un niveau de précision de 99%).
Si une personne, prise au hasard dans la population, déclenche une alerte.
Quelle est la chance qu’elle soit malade du COVID – 19 ?
Votre premier reflex a surement été de considérer que le risque d’erreur était de 1% et qu’il y avait 99% de chances que l’application ait détectée une personne malade.
C’est ça le biais d’oubli de la fréquence de base !
Le bon raisonnement est le suivant :
Si 99% des personnes, porteuses du COVID-19, seront repérées par l’application.
1% des personnes, non porteuses du COVID-19, seront également considérées comme positives.
Ceci représente 99 malades du COVID-19 sur 100 et 9 999 non malade sur 1 million ((1 000 000 – 100) * 1%).
Nous aurons donc (au total) 10 098 alertes
En conclusion (pour une personne prise au hasard dans la population) dès lors qu’une alerte apparaîtra, dans l’application, la probabilité que la personne soit atteinte du COVID-19 sera de 99 sur 10 098 soit 0,98%.
Ou si vous préférez il y aura 99,02% de chances que l’alerte soit fausse.
Si cet article vous a plu, vous pouvez continuer avec Biais de croissance exponentielle et digitalisation.
Ping : Biais de croissance exponentielle et digitalisation. - David LANGLADE