Pourquoi Foresportia utilise-t-il un modèle dédié pour les buts ?

Parce qu'une grille calibrée pour le 1X2 n'est pas nécessairement optimale pour les marchés de buts. Le 1X2 mesure qui gagne ; les marchés de buts mesurent l'intensité et la structure du score.

Les lambdas de buts sont-ils les mêmes que les lambdas 1X2 ?

Non. Les lambdas de buts peuvent être séparés des lambdas utilisés pour la cohérence du 1X2. Cette séparation permet de calibrer les marchés BTTS, Over/Under et scores probables sans dégrader le 1X2.

Un modèle de Poisson suffit-il pour prédire les buts ?

Pas toujours. Le Poisson est utile comme structure de base, mais le football présente de la surdispersion, des dépendances entre équipes et des effets de ligue. Foresportia ajoute donc calibration, priors et couche IA.

Les scores probables sont-ils des prédictions exactes ?

Non. Les scores probables sont des scénarios issus d'une distribution. Même le score le plus probable reste souvent peu probable individuellement.

Modéliser les buts au football : lambdas dédiés, scores probables, BTTS et Over/Under

Pourquoi cet article est essentiel

Une tentation naturelle consiste à dériver tous les marchés d’une seule grille de scores : on construit une matrice cohérente avec le 1X2, puis on somme les cases pour obtenir le BTTS, l’Over 2.5, l’Under 2.5 ou les scores probables. Cette approche est élégante, mais elle pose un problème : une grille optimisée pour le résultat final n’est pas forcément optimale pour le volume de buts.

Foresportia sépare donc deux lectures. Le 1X2 est calibré pour répartir la probabilité entre domicile, nul et extérieur. Les marchés de buts utilisent un moteur dédié, avec des lambdas spécifiquement pensés pour l’intensité offensive, puis une couche de calibration et d’IA légère pour corriger les biais observés.

La réponse à l’objection classique

Dire que les lambdas de buts diffèrent des lambdas 1X2 ne veut pas dire que le 1X2 est mal calibré. Cela signifie que l’on ne force pas un seul objet mathématique à répondre à deux questions différentes. Le 1X2 doit être bon sur les issues ; les marchés de buts doivent être bons sur l’intensité et la structure du score.

1. Pourquoi ne pas tout dériver naïvement du 1X2 ?

Deux matchs peuvent avoir des probabilités 1X2 proches tout en ayant des profils de buts très différents. Un favori peut gagner souvent dans des matchs fermés, ou gagner souvent dans des matchs ouverts. Le même P(H) peut donc correspondre à des matrices de scores différentes.

P(H) = Σ_i>j P(G_H=i, G_A=j)

Cette formule montre que le 1X2 est une somme de nombreuses cases de score. Mais l’inverse n’est pas unique : connaître P(H), P(D) et P(A) ne suffit pas à reconstruire une matrice de buts fiable. On peut avoir le même 1X2 avec plus de 1-0 et 1-1, ou avec plus de 3-1 et 2-2.

Conséquence produit

Si on force les marchés de buts à suivre une grille repondérée pour le 1X2, on risque de conserver une cohérence apparente tout en dégradant les marchés BTTS et Over/Under. C’est exactement ce que le moteur dédié cherche à éviter.

2. Les lambdas de buts : mesurer l’intensité, pas seulement le vainqueur

Le moteur de buts commence par estimer deux intensités :

λ_H = buts attendus par l’équipe à domicile λ_A = buts attendus par l’équipe extérieure

Ces lambdas ne doivent pas être lus comme un score exact. Un λ_H de 1,70 ne signifie pas que l’équipe va marquer 1,70 but. Il signifie que la distribution de ses buts est centrée autour d’une certaine intensité offensive.

Le point important est que ces lambdas sont orientés “marchés de buts”. Ils peuvent tenir compte de signaux offensifs, défensifs, de rythme de ligue, de forme récente et de prudence sur les données faibles, sans être obligés d’épouser exactement les transformations nécessaires au 1X2.

Distribution du total de buts attendus lambda total dans l'historique Foresportia — Figure 1 — Distribution du total de buts attendus : le moteur des buts travaille sur l’intensité du match, pas seulement sur son vainqueur.

3. Pourquoi le Poisson seul est utile, mais insuffisant

Le point de départ classique consiste à modéliser les buts par une loi de Poisson :

G_H ~ Poisson(λ_H) G_A ~ Poisson(λ_A) P(G=k) = e^-λ λ^kk!

Cette approche est utile, car le football est un sport de comptage avec peu d’événements. Mais elle impose des hypothèses fortes : variance liée à la moyenne, indépendance simplifiée des buts, difficulté à représenter certains scores bas ou certains matchs très ouverts.

En pratique, un modèle de buts doit gérer la surdispersion, les effets de ligue, l’équilibre ou le déséquilibre des lambdas, et le fait que le BTTS ou l’Over 2.5 ne répondent pas exactement aux mêmes signaux que le 1X2.

α = exp(c₀ - c₁ · OpenScore)

Cette forme illustre l’idée d’un paramètre de dispersion : le moteur ne se contente pas de deux moyennes de buts. Il ajuste aussi la forme de la distribution selon l’ouverture attendue du match, l’équilibre entre équipes, l’entropie du 1X2, les signaux de niveau et les priors de ligue.

4. De λ à une distribution de scores

Une fois les lambdas estimés, le modèle construit une matrice :

P(G_H=i, G_A=j)

Chaque case correspond à un score possible. La matrice permet ensuite de calculer plusieurs marchés en sommant des zones. C’est ce qui rend l’approche cohérente : BTTS, Over/Under et scores probables viennent d’une même distribution de buts.

Exemple de matrice de scores issue de lambdas de buts — Figure 2 — Exemple de matrice de scores : chaque marché de buts correspond à une somme de zones dans cette matrice.

Ce que la matrice rend visible

Le score le plus probable peut rester faible individuellement. Même un 1-1 ou un 2-1 placé en tête de matrice peut n’avoir que quelques pourcents de probabilité. Le rôle de la matrice n’est donc pas de promettre un score exact, mais de structurer des familles de scénarios.

5. Scores probables : scénarios, pas promesses

Les scores probables sont les cases les plus hautes de la matrice. Ils donnent une lecture qualitative : match fermé, match ouvert, favori net, match équilibré, risque de nul, probabilité que les deux équipes marquent.

Probabilités des scores exacts les plus probables — Figure 3 — Même les scores les plus probables restent très incertains : ils doivent être lus comme des scénarios.

C’est une limite structurelle du football : le score exact est une information très fine, donc très difficile à prévoir. Pour cette raison, Foresportia utilise les scores probables comme un outil de lecture du match, pas comme une promesse de précision.

6. BTTS et Over/Under : sommer les bonnes zones de la matrice

Une fois la matrice construite, les marchés de buts deviennent des sommes de cases.

P(Over 2.5) = P(G_H + G_A ≥ 3)

P(Under 2.5) = P(G_H + G_A ≤ 2)

P(BTTS) = P(G_H ≥ 1, G_A ≥ 1)

Ces marchés sont plus agrégés que le score exact, donc plus stables. Mais ils restent sensibles à la qualité des lambdas, à la dispersion, à la ligue et à la calibration. Une simple grille cohérente avec le 1X2 peut sous-estimer ou surestimer l’ouverture réelle du match.

7. Pourquoi ni le Poisson seul ni l’IA seule ne suffisent

Un modèle purement statistique donne une structure solide : lambdas, matrice, sommes de marchés, calibration interprétable. Mais s’il reste trop rigide, il peut manquer des effets de ligue, des profils de matchs très ouverts, des contextes où les buts sont sous-estimés ou des cas où les données faibles gonflent artificiellement une intensité.

À l’inverse, un modèle uniquement machine learning peut détecter des interactions, mais il travaille sur des événements bruités : un but, un penalty, un carton rouge ou une erreur individuelle peuvent changer totalement le résultat BTTS ou Over/Under. Même sur un large historique, les signaux faibles restent nombreux et le risque de surconfiance existe.

Choix Foresportia

Le moteur le plus robuste est donc hybride : une structure statistique pour construire la distribution de buts, une calibration empirique pour corriger les biais, et une couche IA pour ajuster les paramètres lorsque les signaux historiques indiquent qu’un marché est trop prudent ou trop agressif.

8. Résultat clé : le moteur dédié bat la grille 1X2 sur les marchés de buts

Le test le plus parlant consiste à comparer deux approches :

Grille cohérente 1X2 : elle respecte la distribution domicile/nul/extérieur publiée.
Moteur buts calibré : il utilise des lambdas et une calibration dédiés aux marchés BTTS et Over/Under.

Comparaison entre grille cohérente 1X2 et moteur dédié aux buts — Figure 4 — Sur les marchés de buts, le moteur dédié améliore nettement la lecture par rapport à une grille seulement cohérente avec le 1X2.

Marché	Matchs grille 1X2	Accuracy grille 1X2	Matchs moteur buts	Accuracy moteur buts	Gain
BTTS	3 240	46.5 %	1 818	56.9 %	+10.3 pts
Over 2.5	3 240	48.7 %	1 818	56.5 %	+7.9 pts
Under 2.5	3 240	48.7 %	1 818	56.5 %	+7.8 pts

Cette comparaison ne signifie pas que le 1X2 est mal calibré. Elle signifie que le 1X2 et les buts ne mesurent pas le même objet. Sur le même snapshot, le 1X2 atteint 48.9 % d’accuracy, mais il s’agit d’un problème à trois classes. Les marchés de buts sont des problèmes binaires : ils doivent être évalués avec leurs propres lambdas, leurs propres biais et leur propre calibration.

9. Résultats empiriques et calibration des marchés de buts

Le moteur dédié n’est pas jugé uniquement sur l’accuracy. Une bonne probabilité doit aussi être proche de la fréquence observée. Si un marché est annoncé autour de 55 %, il doit se réaliser autour de 55 % à long terme, sur des groupes de matchs comparables.

Résumé empirique des marchés de buts BTTS Over 2.5 Under 2.5 — Figure 5 — Résumé empirique des marchés de buts : accuracy, probabilité moyenne et fréquence observée.

Marché	Accuracy seuil 50 %	Probabilité moyenne	Fréquence observée	Brier	Log loss
BTTS	56.9 %	53.8 %	56.8 %	0.244	0.681
Over 2.5	56.5 %	50.7 %	52.5 %	0.242	0.678
Under 2.5	56.5 %	49.3 %	47.5 %	0.242	0.678

Le signal est intéressant : les marchés de buts sont moins spectaculaires que les meilleurs segments Stable/Correct du 1X2, mais ils deviennent nettement plus propres lorsqu’ils utilisent leur propre moteur. C’est exactement l’objectif : ne pas vendre des scores certains, mais produire des probabilités de buts plus cohérentes, plus prudentes et vérifiables.

10. Calibration : rapprocher probabilité annoncée et fréquence observée

La calibration est la couche qui transforme une sortie brute en probabilité exploitable. Sans calibration, un modèle peut très bien classer les matchs tout en étant trop confiant ou trop prudent.

p_calibrated = σ(a + b · logit(p_raw))

Cette forme illustre une calibration logistique : on ne change pas l’idée du modèle, on corrige sa pente et son niveau moyen pour mieux aligner les probabilités avec les résultats observés.

Courbe de calibration simplifiée des marchés de buts — Figure 6 — Courbe de calibration simplifiée : une probabilité utile doit se comporter comme une fréquence observée.

Pourquoi calibrer séparément les buts ?

La calibration du 1X2 cherche à répartir correctement domicile, nul et extérieur. La calibration des buts cherche à aligner l’intensité du match avec des événements binaires comme BTTS ou Over 2.5. Ce sont des objectifs voisins, mais pas identiques. Les calibrer séparément évite de corriger un marché au détriment d’un autre.

11. Garde-fous : données faibles, ligues rares et surconfiance

Les marchés de buts sont particulièrement sensibles aux petits échantillons. Une équipe peut avoir joué peu de matchs comparables, une ligue peut changer de rythme, ou quelques résultats très ouverts peuvent gonfler artificiellement une moyenne.

Foresportia applique donc des garde-fous : prior de ligue, retrait vers une moyenne plus stable lorsque l’échantillon est fragile, limitation des lambdas extrêmes, et corrections lorsque la combinaison de signaux semble trop agressive sur BTTS ou Over 2.5.

λ'_H = (1 - w)λ_H + wλ_H,stable λ'_A = (1 - w)λ_A + wλ_A,stable

Cette écriture illustre une logique de prudence : lorsque les données sont fragiles, le modèle ne doit pas augmenter artificiellement la pression de buts. Il doit au contraire revenir vers une zone plus stable.

12. Limites : ce que le moteur de buts ne peut pas promettre

Même avec un moteur dédié, les buts restent difficiles. Un penalty, un carton rouge, une blessure, un gardien en état de grâce, une pluie forte ou un plan tactique très fermé peuvent casser la distribution attendue.

Le score exact reste le marché le plus incertain. BTTS et Over/Under sont plus stables car ils agrègent plusieurs scores, mais ils ne deviennent jamais déterministes. Le rôle du modèle n’est pas de promettre un total de buts ; il est de produire une probabilité mieux alignée avec les fréquences observées.

Conclusion : les buts méritent leur propre modèle

Cette note explique pourquoi Foresportia sépare le moteur 1X2 du moteur des buts. Le 1X2 répond à la question du résultat final. Les marchés BTTS, Over/Under et scores probables répondent à une question d’intensité et de structure de match.

📌

Conclusion-clé

Un modèle de buts robuste n’est ni un Poisson brut, ni une IA brute. C’est une architecture hybride : lambdas dédiés, distribution de scores, calibration, priors de ligue, garde-fous et apprentissage sur l’historique.

La dernière note de la série expliquera comment évaluer l’ensemble du système : baselines, calibration, Brier score, log loss, drift temporel et limites scientifiques.

FAQ rapide

Pourquoi les lambdas de buts peuvent-ils différer des lambdas 1X2 ?

Parce qu’ils ne répondent pas au même objectif. Les lambdas 1X2 servent à soutenir la cohérence du résultat final ; les lambdas de buts servent à modéliser l’intensité du score.

Un modèle Poisson bien calibré suffit-il ?

Il constitue une bonne base, mais il reste trop rigide seul. Les effets de ligue, la surdispersion, les matchs très ouverts ou fermés et la calibration empirique nécessitent des couches supplémentaires.

Pourquoi ne pas utiliser uniquement du machine learning ?

Parce que les buts sont rares et bruités. Une IA pure peut détecter des signaux faibles, mais elle peut aussi surapprendre. Foresportia conserve donc une structure statistique explicable.

Des probabilités 1X2 aux buts attendus : scores probables, BTTS et Over/Under

Idée centrale

Pourquoi cet article est essentiel

1. Pourquoi ne pas tout dériver naïvement du 1X2 ?

2. Les lambdas de buts : mesurer l’intensité, pas seulement le vainqueur

3. Pourquoi le Poisson seul est utile, mais insuffisant

4. De λ à une distribution de scores

5. Scores probables : scénarios, pas promesses

6. BTTS et Over/Under : sommer les bonnes zones de la matrice

7. Pourquoi ni le Poisson seul ni l’IA seule ne suffisent

8. Résultat clé : le moteur dédié bat la grille 1X2 sur les marchés de buts

9. Résultats empiriques et calibration des marchés de buts

10. Calibration : rapprocher probabilité annoncée et fréquence observée

11. Garde-fous : données faibles, ligues rares et surconfiance

12. Limites : ce que le moteur de buts ne peut pas promettre

Conclusion : les buts méritent leur propre modèle

Conclusion-clé

FAQ rapide

Voir les marchés de buts en pratique

Des probabilités 1X2 aux buts attendus : scores probables, BTTS et Over/Under

Idée centrale

Pourquoi cet article est essentiel

1. Pourquoi ne pas tout dériver naïvement du 1X2 ?

2. Les lambdas de buts : mesurer l’intensité, pas seulement le vainqueur

3. Pourquoi le Poisson seul est utile, mais insuffisant

4. De λ à une distribution de scores

5. Scores probables : scénarios, pas promesses

6. BTTS et Over/Under : sommer les bonnes zones de la matrice

7. Pourquoi ni le Poisson seul ni l’IA seule ne suffisent

8. Résultat clé : le moteur dédié bat la grille 1X2 sur les marchés de buts

9. Résultats empiriques et calibration des marchés de buts

10. Calibration : rapprocher probabilité annoncée et fréquence observée

11. Garde-fous : données faibles, ligues rares et surconfiance

12. Limites : ce que le moteur de buts ne peut pas promettre

Conclusion : les buts méritent leur propre modèle

Conclusion-clé

FAQ rapide

Voir les marchés de buts en pratique

Articles liés