Quand trier du texte avant nettoyage, analyse ou publication
Guide pratique pour savoir quand le tri du texte doit intervenir avant le nettoyage, la relecture ou les decisions editoriales.
Il faut trier tot quand la liste est surtout difficile a lire
Certains problemes de texte relevent de la qualite. D autres relevent de la lisibilite. Si la liste pourrait deja etre utile mais que ses motifs restent invisibles, il vaut mieux trier assez tot. Le tri montre la structure avant les suppressions et les retouches.
C est tres utile pour les listes de mots cles, les listes de noms, les notes collees et les exports de plusieurs sources. L information existe deja, mais l ordre brut empeche de bien la voir.
Le tri n est pas un nettoyage complet
Trier ne veut pas dire nettoyer tout le jeu de donnees. C est avant tout une etape de visibilite. Elle permet d inspecter le materiau avant de decider ce qu il faut retirer, normaliser ou conserver. C est pourquoi le tri precede souvent le dedoublonnage.
L avantage est que les decisions de nettoyage deviennent moins arbitraires. Lorsque les elements proches se retrouvent cote a cote, il est plus facile de voir s il s agit de doublons, de variantes ou d entrees a garder separees.
Trier tot sauf si l ordre initial garde une vraie valeur
Pour la plupart des listes brutes, trier tot est le meilleur choix. Mais si l ordre original porte encore un signal utile, mieux vaut parfois l examiner d abord puis trier ensuite a partir d une copie. Le bon moment depend du role de la sequence initiale.
C est pour cela que le tri de texte est une decision de workflow. Au bon moment, il rend toutes les etapes suivantes plus fiables. Il ne se contente pas de ranger la liste: il la rend plus intelligible.