Idée centrale
Le 1X2 répond à une question : qui gagne ? Les marchés de buts répondent à une autre question : comment le match se structure en volume de buts ? Ces deux questions sont liées, mais elles ne doivent pas être calibrées avec exactement le même moteur.
Pourquoi cet article est essentiel
Une tentation naturelle consiste à dériver tous les marchés d’une seule grille de scores : on construit une matrice cohérente avec le 1X2, puis on somme les cases pour obtenir le BTTS, l’Over 2.5, l’Under 2.5 ou les scores probables. Cette approche est élégante, mais elle pose un problème : une grille optimisée pour le résultat final n’est pas forcément optimale pour le volume de buts.
Foresportia sépare donc deux lectures. Le 1X2 est calibré pour répartir la probabilité entre domicile, nul et extérieur. Les marchés de buts utilisent un moteur dédié, avec des lambdas spécifiquement pensés pour l’intensité offensive, puis une couche de calibration et d’IA légère pour corriger les biais observés.
Dire que les lambdas de buts diffèrent des lambdas 1X2 ne veut pas dire que le 1X2 est mal calibré. Cela signifie que l’on ne force pas un seul objet mathématique à répondre à deux questions différentes. Le 1X2 doit être bon sur les issues ; les marchés de buts doivent être bons sur l’intensité et la structure du score.
1. Pourquoi ne pas tout dériver naïvement du 1X2 ?
Deux matchs peuvent avoir des probabilités 1X2 proches tout en ayant des profils de buts très différents.
Un favori peut gagner souvent dans des matchs fermés, ou gagner souvent dans des matchs ouverts.
Le même P(H) peut donc correspondre à des matrices de scores différentes.
Cette formule montre que le 1X2 est une somme de nombreuses cases de score. Mais l’inverse n’est pas unique :
connaître P(H), P(D) et P(A) ne suffit pas à reconstruire une matrice de buts fiable.
On peut avoir le même 1X2 avec plus de 1-0 et 1-1, ou avec plus de 3-1 et 2-2.
Si on force les marchés de buts à suivre une grille repondérée pour le 1X2, on risque de conserver une cohérence apparente tout en dégradant les marchés BTTS et Over/Under. C’est exactement ce que le moteur dédié cherche à éviter.
2. Les lambdas de buts : mesurer l’intensité, pas seulement le vainqueur
Le moteur de buts commence par estimer deux intensités :
Ces lambdas ne doivent pas être lus comme un score exact. Un λH de 1,70 ne signifie pas
que l’équipe va marquer 1,70 but. Il signifie que la distribution de ses buts est centrée autour d’une certaine intensité offensive.
Le point important est que ces lambdas sont orientés “marchés de buts”. Ils peuvent tenir compte de signaux offensifs, défensifs, de rythme de ligue, de forme récente et de prudence sur les données faibles, sans être obligés d’épouser exactement les transformations nécessaires au 1X2.
3. Pourquoi le Poisson seul est utile, mais insuffisant
Le point de départ classique consiste à modéliser les buts par une loi de Poisson :
Cette approche est utile, car le football est un sport de comptage avec peu d’événements. Mais elle impose des hypothèses fortes : variance liée à la moyenne, indépendance simplifiée des buts, difficulté à représenter certains scores bas ou certains matchs très ouverts.
En pratique, un modèle de buts doit gérer la surdispersion, les effets de ligue, l’équilibre ou le déséquilibre des lambdas, et le fait que le BTTS ou l’Over 2.5 ne répondent pas exactement aux mêmes signaux que le 1X2.
Cette forme illustre l’idée d’un paramètre de dispersion : le moteur ne se contente pas de deux moyennes de buts. Il ajuste aussi la forme de la distribution selon l’ouverture attendue du match, l’équilibre entre équipes, l’entropie du 1X2, les signaux de niveau et les priors de ligue.
4. De λ à une distribution de scores
Une fois les lambdas estimés, le modèle construit une matrice :
Chaque case correspond à un score possible. La matrice permet ensuite de calculer plusieurs marchés en sommant des zones. C’est ce qui rend l’approche cohérente : BTTS, Over/Under et scores probables viennent d’une même distribution de buts.
Le score le plus probable peut rester faible individuellement. Même un 1-1 ou un 2-1 placé en tête de matrice peut n’avoir que quelques pourcents de probabilité. Le rôle de la matrice n’est donc pas de promettre un score exact, mais de structurer des familles de scénarios.
5. Scores probables : scénarios, pas promesses
Les scores probables sont les cases les plus hautes de la matrice. Ils donnent une lecture qualitative : match fermé, match ouvert, favori net, match équilibré, risque de nul, probabilité que les deux équipes marquent.
C’est une limite structurelle du football : le score exact est une information très fine, donc très difficile à prévoir. Pour cette raison, Foresportia utilise les scores probables comme un outil de lecture du match, pas comme une promesse de précision.
6. BTTS et Over/Under : sommer les bonnes zones de la matrice
Une fois la matrice construite, les marchés de buts deviennent des sommes de cases.
Ces marchés sont plus agrégés que le score exact, donc plus stables. Mais ils restent sensibles à la qualité des lambdas, à la dispersion, à la ligue et à la calibration. Une simple grille cohérente avec le 1X2 peut sous-estimer ou surestimer l’ouverture réelle du match.
7. Pourquoi ni le Poisson seul ni l’IA seule ne suffisent
Un modèle purement statistique donne une structure solide : lambdas, matrice, sommes de marchés, calibration interprétable. Mais s’il reste trop rigide, il peut manquer des effets de ligue, des profils de matchs très ouverts, des contextes où les buts sont sous-estimés ou des cas où les données faibles gonflent artificiellement une intensité.
À l’inverse, un modèle uniquement machine learning peut détecter des interactions, mais il travaille sur des événements bruités : un but, un penalty, un carton rouge ou une erreur individuelle peuvent changer totalement le résultat BTTS ou Over/Under. Même sur un large historique, les signaux faibles restent nombreux et le risque de surconfiance existe.
Le moteur le plus robuste est donc hybride : une structure statistique pour construire la distribution de buts, une calibration empirique pour corriger les biais, et une couche IA pour ajuster les paramètres lorsque les signaux historiques indiquent qu’un marché est trop prudent ou trop agressif.
8. Résultat clé : le moteur dédié bat la grille 1X2 sur les marchés de buts
Le test le plus parlant consiste à comparer deux approches :
- Grille cohérente 1X2 : elle respecte la distribution domicile/nul/extérieur publiée.
- Moteur buts calibré : il utilise des lambdas et une calibration dédiés aux marchés BTTS et Over/Under.
| Marché | Matchs grille 1X2 | Accuracy grille 1X2 | Matchs moteur buts | Accuracy moteur buts | Gain |
|---|---|---|---|---|---|
| BTTS | 3 240 | 46.5 % | 1 818 | 56.9 % | +10.3 pts |
| Over 2.5 | 3 240 | 48.7 % | 1 818 | 56.5 % | +7.9 pts |
| Under 2.5 | 3 240 | 48.7 % | 1 818 | 56.5 % | +7.8 pts |
Cette comparaison ne signifie pas que le 1X2 est mal calibré. Elle signifie que le 1X2 et les buts ne mesurent pas le même objet. Sur le même snapshot, le 1X2 atteint 48.9 % d’accuracy, mais il s’agit d’un problème à trois classes. Les marchés de buts sont des problèmes binaires : ils doivent être évalués avec leurs propres lambdas, leurs propres biais et leur propre calibration.
9. Résultats empiriques et calibration des marchés de buts
Le moteur dédié n’est pas jugé uniquement sur l’accuracy. Une bonne probabilité doit aussi être proche de la fréquence observée. Si un marché est annoncé autour de 55 %, il doit se réaliser autour de 55 % à long terme, sur des groupes de matchs comparables.
| Marché | Accuracy seuil 50 % | Probabilité moyenne | Fréquence observée | Brier | Log loss |
|---|---|---|---|---|---|
| BTTS | 56.9 % | 53.8 % | 56.8 % | 0.244 | 0.681 |
| Over 2.5 | 56.5 % | 50.7 % | 52.5 % | 0.242 | 0.678 |
| Under 2.5 | 56.5 % | 49.3 % | 47.5 % | 0.242 | 0.678 |
Le signal est intéressant : les marchés de buts sont moins spectaculaires que les meilleurs segments Stable/Correct du 1X2, mais ils deviennent nettement plus propres lorsqu’ils utilisent leur propre moteur. C’est exactement l’objectif : ne pas vendre des scores certains, mais produire des probabilités de buts plus cohérentes, plus prudentes et vérifiables.
10. Calibration : rapprocher probabilité annoncée et fréquence observée
La calibration est la couche qui transforme une sortie brute en probabilité exploitable. Sans calibration, un modèle peut très bien classer les matchs tout en étant trop confiant ou trop prudent.
Cette forme illustre une calibration logistique : on ne change pas l’idée du modèle, on corrige sa pente et son niveau moyen pour mieux aligner les probabilités avec les résultats observés.
La calibration du 1X2 cherche à répartir correctement domicile, nul et extérieur. La calibration des buts cherche à aligner l’intensité du match avec des événements binaires comme BTTS ou Over 2.5. Ce sont des objectifs voisins, mais pas identiques. Les calibrer séparément évite de corriger un marché au détriment d’un autre.
11. Garde-fous : données faibles, ligues rares et surconfiance
Les marchés de buts sont particulièrement sensibles aux petits échantillons. Une équipe peut avoir joué peu de matchs comparables, une ligue peut changer de rythme, ou quelques résultats très ouverts peuvent gonfler artificiellement une moyenne.
Foresportia applique donc des garde-fous : prior de ligue, retrait vers une moyenne plus stable lorsque l’échantillon est fragile, limitation des lambdas extrêmes, et corrections lorsque la combinaison de signaux semble trop agressive sur BTTS ou Over 2.5.
Cette écriture illustre une logique de prudence : lorsque les données sont fragiles, le modèle ne doit pas augmenter artificiellement la pression de buts. Il doit au contraire revenir vers une zone plus stable.
12. Limites : ce que le moteur de buts ne peut pas promettre
Même avec un moteur dédié, les buts restent difficiles. Un penalty, un carton rouge, une blessure, un gardien en état de grâce, une pluie forte ou un plan tactique très fermé peuvent casser la distribution attendue.
Le score exact reste le marché le plus incertain. BTTS et Over/Under sont plus stables car ils agrègent plusieurs scores, mais ils ne deviennent jamais déterministes. Le rôle du modèle n’est pas de promettre un total de buts ; il est de produire une probabilité mieux alignée avec les fréquences observées.
Conclusion : les buts méritent leur propre modèle
Cette note explique pourquoi Foresportia sépare le moteur 1X2 du moteur des buts. Le 1X2 répond à la question du résultat final. Les marchés BTTS, Over/Under et scores probables répondent à une question d’intensité et de structure de match.
Conclusion-clé
Un modèle de buts robuste n’est ni un Poisson brut, ni une IA brute. C’est une architecture hybride : lambdas dédiés, distribution de scores, calibration, priors de ligue, garde-fous et apprentissage sur l’historique.
La dernière note de la série expliquera comment évaluer l’ensemble du système : baselines, calibration, Brier score, log loss, drift temporel et limites scientifiques.
FAQ rapide
Pourquoi les lambdas de buts peuvent-ils différer des lambdas 1X2 ?
Parce qu’ils ne répondent pas au même objectif. Les lambdas 1X2 servent à soutenir la cohérence du résultat final ; les lambdas de buts servent à modéliser l’intensité du score.
Un modèle Poisson bien calibré suffit-il ?
Il constitue une bonne base, mais il reste trop rigide seul. Les effets de ligue, la surdispersion, les matchs très ouverts ou fermés et la calibration empirique nécessitent des couches supplémentaires.
Pourquoi ne pas utiliser uniquement du machine learning ?
Parce que les buts sont rares et bruités. Une IA pure peut détecter des signaux faibles, mais elle peut aussi surapprendre. Foresportia conserve donc une structure statistique explicable.
Voir les marchés de buts en pratique
Les probabilités BTTS, Over/Under et scores probables sont visibles dans les pages de résultats et les sélections IA.
Voir les matchs du jour