Classer et regrouper des documents
Commentaires Composés : Classer et regrouper des documents. Recherche parmi 300 000+ dissertationsPar paul62 • 23 Mars 2013 • 245 Mots (1 Pages) • 2 054 Vues
Regrouper des documents par catégories améliore la cohérence et la lisibilité d'une collection. La classification par sujet organise des entités d'un point de vue conceptuel, par différence avec le classement qui range des éléments dans l'espace. Plusieurs critères, seuls ou combinés, servent à cette catégorisation : la forme, l'auditoire potentiel, le contenu, la valeur accordée au document. Une classification thématique, plus courante que les autres, situe un document dans une structuration du savoir et de la culture, parfois encyclopédique, comme dans le cas de la Classification Décimale Universelle de Paul Otlet ou la celle de Melvil Dewey. Une classification n'est jamais entièrement neutre et traduit des préférences dans le découpage des connaissances, y compris pour le modèle encyclopédique. 8
L'indexation indique aussi le contenu d'un document, non à partir d'indices, par différence avec la classification, mais avec un vocabulaire en langage naturel ou contrôlés par une liste de descripteurs prédéfinis, relative à un langage documentaire (thésaurus, classification à facettes, assemblage de vedettes-matières comme Rameau 9). Cette opération joue un rôle essentiel dans la recherche d'information car elle facilite grandement les recherches par sujet. Les langages documentaires possèdent l'avantage sur les mots ordinaires de tenir compte des ambiguïtés et de la polysémie du langage ordinaire. L'indexation automatique, utilisée dans les moteurs de recherches, se distingue de l'analyse humaine, car elle évacue l'attention portée au sens au profit d'une approche statistique. Néanmoins, l'étude des relations sémantiques et l'apport du Traitement automatique des langues tentent de combler cet écart.10
...