Le terme « thesaurus » a été employé pour la 1ère fois par P.-M. Roget pour son dictionnaire Thesaurus of english words and phrases (1852) qui donnait les mots avec leurs synonymes et relations sémantiques.
« Le thesaurus est une liste normalisée et structurée de termes acceptés à l’indexation (les descripteurs) et d’équivalents. Les descripteurs sont reliés entre eux par des relations sémantiques (génériques et associatives) exprimés par des signes conventionnels. Les termes sont combinés entre eux pour décrire les documents (lors de l’indexation) et écrire les questions lors de l’interrogation d’une banque de données » (Dictionnaire encyclopédique de l’information et de la documentation)
« Le thesaurus est un dictionnaire de mots ou expressions du langage naturel, termes normalisés et préférentiels, organisé d’une manière conceptuelle présentant les termes groupés par affinité sémantique et complété d’indications de relations » (Les Techniques Documentaires, Que sais-je ?)
« Vocabulaire contrôlé et dynamique de termes (descripteurs et non-descripteurs), obéissant à des règles terminologiques propres et reliés entre eux par des relations sémantiques. Un thesaurus est un langage documentaire postcoordonnés, à structure combinatoire, et sert à indexer les documents et à contrôler les recherches sur les descripteurs » (Alexandre Serres)
Le thesaurus est donc un langage documentaire permettant l’indexation de documents (ou autres). Il permet d’éviter : les synonymies, les polysémies, les orthographes multiples (par ex., on choisira, sauf exceptions, les subsentatifs au masculin et au singulier), la multiplication des mots à l’indexation. Son autre avantage est d’introduire des relations entre les termes.


Commentaires