Quelles variables ? (2)
On peut normaliser ces données :
- fréquence d’occurrence de tel ou tel mot, caractère ...
- fréquence de co-occurrence de tel mot avec tel autre ...
On peut rapporter à un corpus plus vaste pour obtenir des paramètres plus spécifiques :
- fréquence d’occurrence de tel mot divisée par sa fréquence globale ;
- fréquence de co-occurrence du mot m1 avec le mot m2 divisée par la fréquence d’occurrence de m1 ...