Top-k sampling

Le top-k sampling, c’est une technique pour contrôler la diversité des réponses générées par l’IA.

En clair : l’IA choisit sa réponse parmi les « k » options les plus probables. Pas toutes. Juste les meilleures.

Exemple : tu limites k à 10 → elle pioche uniquement parmi les 10 premières suggestions possibles.

Tu veux de la cohérence ? Tu réduis le k.

Tu veux de la créativité ? Tu l’élargis.

C’est un cousin du top-p, mais plus direct. Là où top-p filtre selon une probabilité cumulée, top-k fonctionne avec un nombre fixe de choix.

Pourquoi c’est utile ?

  • Parce que trop de liberté = résultats erratiques.
  • Trop de contraintes = réponses plates.

Un Prompt Engineer pro sait ajuster le top-k pour obtenir le bon équilibre entre fiabilité et variété.

C’est un réglage de finisseur. De sniper.