nternet
est une source d’information plus qu’abondante et mise à jour
régulièrement. Tout le monde peut stocker sur ce réseau des informations
accessibles par tous. François JEANNE-BEYLOT, vous propose une
visite guidée de cette bibliothèque virtuelle. Co-fondateur et
Directeur Général de TROOVER, société spécialisée
dans la recherche d’information structurée et la veille sur Internet,
il vous propose une initiation avec les différents outils facilitant
les requêtes et la veille sur le Net.
Chercher,
rechercher, veiller …
Imaginons
une bibliothèque dont les murs seraient sans cesse repoussés
pour accueillir une quantité d'ouvrages toujours plus importante.
Elle regrouperait tous les sujets imaginables dans toutes les
langues du monde, de l'histoire ancienne jusqu'au fait divers
de la veille, et ce sous toutes les formes. Il y aurait même
une cafétéria où les visiteurs discuteraient,
donneraient leur avis, échangeraient leur culture, interrogeraient
des experts. Ajoutons à celà qu'une grande partie
des ouvrages disponibles seraient mis à jour, non pas par
un bibliothécaire, mais par plusieurs centaines de millions
de visiteurs
S'il nous parait difficile de passer à coté de cet
étrange édifice, il ne nous reste, une fois rentrés
dans cette bibliothèque, plus que deux solutions : flâner
dans les couloirs à la recherche confuse d'information
ou s'installer dans l'allée qui nous intéresse et
y surveiller tous les mouvements, non seulement des ouvrages,
mais aussi des lecteurs et des visiteurs. Un tel rassemblement
de connaissances serait l'endroit rêvé d'un homme
avide de savoir, en quête d'information ou tout simplement
curieux.
Ce rêve, vous l'avez deviné, est à quelques
clics de souris de chacun d'entre nous et, si la bibliothèque
est virtuelle, l'information y est bien présente : un milliard
de pages en ligne, 93 millions de sites Internet et près
d'un million de nouvelles pages par jour le tout visité
par quelques 380 millions de personnes. Nous sommes connectés,
nous sommes donc visiteurs et acteurs, choisissons notre stratégie
de recherche, le sens de notre visite dans les allées du
savoir.
Pour une requête précise, les outils de recherche
(moteur et annuaires), véritables documentalistes de la
Toile, nous guideront vers l'ouvrage, le site approprié.
Ces robots visitent de manière quasi instantanée,
l'ensemble des allées de la bibliothèque, à
l'affût du moindre ouvrage relatif à notre recherche.
Ils vont non seulement chercher sur les titres mais aussi scanner
tous les index et les pages pour y retrouver nos mots-clés.
Si notre champ de recherche s'agrandit, si notre investigation
recoupe plusieurs domaine, comme c'est souvent le cas, l'utilisation
de plusieurs outils accroît les chances de réussite
; on choisira un outil généraliste doublé
d'un annuaire ou d'un moteur spécialisé. Des recoupements
nous permettrons d'affiner notre requête afin de supprimer
les doublons et réduire le nombre d'ouvrages aux plus pertinents
et donc d'optimiser le temps de lecture. Enfin, nous avons recueilli
la liste des documents contenant l'information recherchée,
il ne reste plus qu'à les analyser.
Mais avouez que, vue l'architecture de notre bibliothèque
et sa tendance à l'enrichissement perpétuel, il
serait dommage de s'arrêter là ! Maintenant que l'on
a identifié les sources, il serait intéressant d'être
informé des changements et des nouveautés sur le
sujet, et pourquoi pas de connaître et échanger avec
d'autres personnes, expertes ou non.
Nous allons donc passer
de la recherche à la veille.
Nous pourrions revenir dans quelque temps et refaire la même
recherche ; par comparaison avec la première, nous obtiendront
les changements. Afin d'être averti de ces changements au
plus près de leur parution, il convient de répéter
cette tâche le plus souvent possible. Pour ce faire, Internet
offre des outils d'automatisation des actions de recherche qui
vont, à intervalles réguliers lancer leurs robots
pour parcourir à nouveau l'ensemble du réseau. Mieux
encore, certains logiciels "push" permettent de se tenir
informé en cas de changements, en l'occurrence des nouveaux
entrants, sur un domaine d'intérêt. Comme une caméra
fixée dans l'allée de la bibliothèque qui
nous intéresse, ils nous préviendront dès
qu'un nouvel ouvrage rejoindra le rayon. Une fois paramétrés,
ils nous enverront, le plus souvent par mail, les références
des nouveaux documents.
De même, on trouvera des aspirateurs de sites permettant
de comparer le contenu des pages d'une requête à
l'autre ; comme sur deux photographies, ces outils nous permettent
de suivre les évolutions des sites et leurs mises à
jour. Ils offrent également la possibilité d'enregistrer
le contenu d'un site Web. Cette fonctionnalité peut se
révéler fort utile, car, il faut l'avouer notre
bibliothèque virtuelle connaît encore quelques défauts,
et notamment celui de ne garder que la dernière version
d'un document. En effet, lorsqu'un webmaster apporte des corrections
à une page Internet, une fois celle-ci mise en ligne, il
vous sera très difficile, voire quasiment impossible de
retrouver la version précédente. Pis encore, s'il
supprime une de ces pages, à l'adresse indiquée
répondra une page "404 NOT FOUND" et vous rencontrerez
les plus grandes peines du monde pour la retrouver. Ainsi, les
aspirateurs de sites apportent une solution, encore faut-il avoir
aspiré la page avant les méfaits du webmaster !
Vous l'aurez compris, on ne peut, faute de place sur nos disques
durs, aspirer le web entier, il convient donc de faire une sélection
méticuleuse lors de la première recherche et ne
s'arrêter que sur les sites dignes d'un réel intérêt.
On pourra par exemple, surveiller de cette manière le site
d'un concurrent ; on lancera un logiciel en "push" pour
se tenir informé de l'arrivée de nouveaux concurrents
ou pour instituer une veille référentielle sur son
propre site Internet, ainsi le robot interrogera régulièrement
les moteurs de recherche et annuaires et enverra uniquement les
nouveaux résultats.
François JEANNE-BEYLOT
TROOVER.Com
fjb@troover.com
Tous
droits réservés - Reproduction même partielle interdite sans
autorisation préalable
|