Résumé en une phrase
Une probabilité n’a de valeur que si elle est calibrée : quand on annonce 60 %, on doit observer ~6 victoires sur 10 sur un grand nombre de matchs. Cet article explique comment nous vérifions (et corrigeons) cette propriété dans Foresportia.
Précision ≠ Calibration
La précision (le % de prédictions correctes) et la calibration (l’adéquation statistique entre probabilités annoncées et fréquences réellement observées) sont deux notions différentes. On peut obtenir une bonne précision en ciblant seulement des matchs très faciles… tout en étant mal calibré et donc trompeur sur les probabilités.
- Bien calibré : sur tous les matchs cotés à ~70 %, on gagne ~70 % du temps.
- Sur-confiant : on annonce 70 %, on gagne 62–65 %.
- Sous-confiant : on annonce 70 %, on gagne 75–78 %.
L’objectif n’est pas d’être « optimiste », mais d’être honnête statistiquement : c’est ce qui permet de prendre des décisions raisonnées (seuils, gestion du risque, diversification).
Nos métriques de fiabilité
Brier Score
Le Brier score mesure l’erreur quadratique entre les probabilités annoncées et les issues observées (0/1). Plus il est bas, mieux c’est. Il pénalise particulièrement les certitudes mal fondées.
LogLoss
La LogLoss (logarithmic loss) punit les faux pas très confiants. Elle est sensible à la probabilité précise attribuée au bon événement.
Courbe de fiabilité (Reliability Diagram)
Nous regroupons les matchs en tranches de 5 % (50–55, 55–60, …) puis comparons la probabilité moyenne annoncée à la fréquence réellement observée. La diagonale représente la calibration parfaite.
Ce qui a changé récemment dans Foresportia
Suite à la mise à jour décrite dans l’article 17, nous avons :
- appliqué une recalibration isotonic par ligue et non plus globale ;
- ajouté une pondération temporelle pour réagir aux changements récents (time-decay) ;
- corrigé un effet de « confiance dupliquée » dans la zone 55–65 % ;
- renforcé les critères de validation (Brier, LogLoss) avant tout déploiement.
Résultat : davantage de probabilités réellement « tenues » dans les tranches 55–75 %, là où se joue l’essentiel des décisions.
Avant / Après : lecture de la courbe
Sur la période d’évaluation Q2 2025 (multi-ligues), la courbe « après » se rapproche sensiblement de la diagonale. La baisse conjointe du Brier score et de la LogLoss confirme l’amélioration. Concrètement, les probabilités 60–70 % sont désormais mieux étalonnées : moins de faux positifs « trop confiants ».
Comment utiliser les probabilités calibrées
1) Choisir un seuil adapté au contexte
Un seuil trop haut réduit le volume (risque de manquer des valeurs), un seuil trop bas augmente la variance. Avec une calibration plus fiable, on peut abaisser légèrement les seuils dans certaines ligues sans dégrader le taux réel.
2) Ajuster par ligue
Les dynamiques ne sont pas les mêmes partout. À titre indicatif (évolutif) :
- Ligue 1 : ~59 %
- Premier League : ~61 %
- Serie A : ~60 %
- J.League : ~63 %
- MLS : ~65 %
Référez-vous à Résultats passés pour les derniers chiffres par ligue (mise à jour continue).
3) Décider avec un indicateur de valeur
La calibration ne garantit pas un ROI à elle seule. Combinez-la avec un modèle de valeur attendue (cote réelle estimée vs cote marché), une gestion de mise prudente (ex. fractional Kelly) et une diversification inter-ligues.
Questions fréquentes
Une meilleure calibration augmente-t-elle toujours le taux de réussite ?
Pas nécessairement, mais elle réduit les erreurs coûteuses liées à une sur-confiance. Dans notre cas, calibration renforcée et légère hausse du taux global ont été observées conjointement.
Pourquoi calibrer par ligue plutôt que globalement ?
Parce que la variance, la fréquence des nuls et l’impact de l’arbitrage diffèrent fortement selon les compétitions. La calibration par ligue évite qu’une ligue très volatile « tire » la calibration des autres.
Comment savoir si un seuil est trop agressif ?
Surveillez la courbe de fiabilité dans la zone ciblée et votre variance de résultats. Si la fréquence observée passe nettement sous la proba annoncée, relevez le seuil ou changez de ligue cible.
Conclusion
La calibration, c’est la vérité statistique derrière un pourcentage. En l’améliorant, Foresportia rend ses probabilités actionnables : vos seuils sont plus justes, vos décisions plus robustes.