Textes et catégories
L’ensemble des textes est donné, au moins en partie ;
L’ensemble des catégories peut être ou ne pas être donné.
Quand l’ensemble des catégories n’est pas donné au départ, il s’agit de le créer en regroupant les textes en classes qui possédent un certain degré de cohérence interne
On parle alors de clustering