Le top-k sampling, c’est une technique pour contrôler la diversité des réponses générées par l’IA.
En clair : l’IA choisit sa réponse parmi les « k » options les plus probables. Pas toutes. Juste les meilleures.
Exemple : tu limites k à 10 → elle pioche uniquement parmi les 10 premières suggestions possibles.
Tu veux de la cohérence ? Tu réduis le k.
Tu veux de la créativité ? Tu l’élargis.
C’est un cousin du top-p, mais plus direct. Là où top-p filtre selon une probabilité cumulée, top-k fonctionne avec un nombre fixe de choix.
Pourquoi c’est utile ?
- Parce que trop de liberté = résultats erratiques.
- Trop de contraintes = réponses plates.
Un Prompt Engineer pro sait ajuster le top-k pour obtenir le bon équilibre entre fiabilité et variété.
C’est un réglage de finisseur. De sniper.