takamac a dit:
Par recherche "full text", tu veux dire qu'il ne passe pas par un importateur ? Il regarde "en aveugle" le contenu du fichier et en déduit les mots contenus dedans, c'est ça ?
C'est cet aspect-là qui m'intrigue. je trouve ça un peu magique :eek:
Mais bon, j'ai pas l'impression d'être clair, et il y a peut-être autre chose que j'ai pas compris, en fait
Bon, ouf !, finalement, j'avais compris ta question
Et ne t'inquiète pas : on n'est jamais supposé tout savoir sur tout
Le principe des importateurs est que tu renseignes des champs déterminés pour un fichier. Pratique pour des images ou des vidéos. Même pour un document de nature plus textuelle, cela permet de donner davantage de "sens". Je mets des double-quotes car en l'occurrence, c'est toi (via les champs que tu renseignes) qui donne du sens, pas le programme ...
Dans la recherche "full text", l'ensemble des mots du texte du document est indexé. Donc Spotlight peut ensuite trouver d'une part quels documents contiennent tel(s) mot(s) puis, d'autre part, les situer dans le document. C'est une technique en soi assez ancienne dans le principe (c'est une part du travail à l'oeuvre chez Google, Verity, Fullcrum etc.). Peut-être y a-t-il des trucs extramidables en plus dans Spotlight (va savoir).
Donc Spotlight allie le travail avec des importateurs avec celui plus classique d'indexation globale des mots d'un texte.
Un exemple : dans un document Word, tu peux aisément définir des propriétés pour ce document, telles que : auteur, mots-clefs, versions etc. et même en ajouter autant qu'il te plaît (menu fichier + propriétés). Là, tu donnes du sens (l'auteur, c'est moi, la version est la 0.0.2 etc.). Tandis que le texte sera considéré simplement comme une donnée "quelconque".