Résumé rapide
Un seuil, c’est une règle simple : on ne retient que les matchs dont la probabilité (ex. victoire domicile) est ≥ à une valeur (ex. 60%). Baisser le seuil = plus de matchs (plus de couverture), mais souvent plus d’erreurs. Monter le seuil = moins de matchs, mais une précision qui tend à augmenter. L’objectif n’est pas de “deviner”, mais de choisir un compromis cohérent avec ton usage.
Couverture vs précision : le vrai dilemme
Beaucoup de gens pensent qu’il suffit de “prendre les plus grosses probabilités”. En pratique, c’est plus subtil : quand tu montes le seuil, tu sélectionnes des matchs plus “clairs” selon le modèle, mais tu réduis aussi le nombre d’opportunités.
Définitions simples (rappel utile) :
- Couverture : combien de matchs tu gardes après filtrage (volume).
- Précision : parmi ces matchs, quelle proportion est correcte (taux de réussite).
- Variance : à quel point les résultats peuvent fluctuer (séries bonnes/mauvaises).
Une méthode simple en 5 étapes (compréhensible, même sans être expert)
- Choisir un périmètre : par ligue, ou global, et sur une période assez longue.
- Tester plusieurs seuils (ex. 50%, 55%, 60%, 65%, 70%). L’idée est de voir comment la couverture et la précision bougent.
- Comparer les courbes : à partir de quel seuil la couverture s’effondre ? À partir de quel seuil le gain de précision devient marginal ?
- Stabiliser : choisir un seuil qui n’est pas “optimal sur une semaine” mais stable sur le temps.
- Adapter par ligue : certaines ligues sont plus stables, d’autres plus imprévisibles. Un même seuil n’a pas le même sens partout.
(Si tu veux comprendre pourquoi les probabilités doivent être “fiables”, pas juste “hautes” : calibration des probabilités.)
Règles pratiques (simples et efficaces)
- Évite les seuils trop agressifs si tu veux apprendre : un seuil très haut donne peu d’exemples.
- Évite les seuils trop bas si tu veux de la stabilité : plus tu “couvres”, plus l’incertitude monte.
- Regarde le couple “taux de réussite + nombre de matchs”. Un 75% sur 8 matchs n’a pas la même solidité qu’un 62% sur 200 matchs.
- Ne cherche pas un seuil unique universel : le football n’est pas uniforme entre ligues.
Scénarios concrets (pour comprendre sans jargon)
Exemple de lecture (purement pédagogique) : si tu passes d’un seuil de 55% à 65%, tu peux observer moins de matchs, mais un taux de réussite qui monte. La question à se poser est : “Est-ce que le gain vaut la perte de couverture ?”.
- Objectif : apprendre / explorer → seuil modéré, couverture correcte.
- Objectif : ne garder que l’essentiel → seuil plus haut, peu de matchs, plus “robustes”.
- Objectif : multi-ligues → seuils par ligue (sinon une ligue “bruitée” pollue tout).
Pour compléter avec un bon “garde-fou” : indice de confiance (utile pour visualiser quand le modèle est plus incertain).
Check-list avant de publier / figer des seuils
- Ai-je assez de matchs sur la période (éviter de sur-optimiser sur peu de données) ?
- Le seuil est-il stable sur plusieurs mois, pas juste sur une série ?
- Ai-je un seuil par ligue quand les profils de ligues sont différents ?
- Ai-je un indicateur d’incertitude (forme, absences, signaux faibles) ?
- Ai-je documenté clairement ce que signifie “60%” (fréquence attendue, pas certitude) ?
Conclusion
Choisir un seuil, ce n’est pas “trouver un chiffre magique”. C’est décider d’un compromis entre volume (couverture) et stabilité (précision), idéalement par ligue, et en restant cohérent dans le temps.