Internet
Gén. multilingues
Google
Alltheweb
Altavista
Hot-Bot
Lycos
MSN
Wisenut
Google

Présentation

Nom

Google

URL

http://www.google.com/
http://www.google.fr/
http://www.google.be

Date de lancement

1998

Taille de l'index

2,5 milliards de pages

Délai de rafraichissement

4 semaines

Nom du spider

Googlebot

URL intéressantes

Aide en ligne

Sommaire de  l'aide

Configuration

Choix de la langue et du filtre familial

Historique

Ce moteur de recherche (dont le nom est dérivé du terme "Googol" qui signifie "10 à la puissance 100") a été créé en 1998 par deux étudiants de l'université de Stanford (comme Yahoo!), Larry Page et Sergey Brin. Il est issu d'un projet de recherche de l'université. En juin 1999, les deux co-fondateurs lèvent 25 millions de $ de capitaux et lancent réellement l'outil qui est aujourd'hui basé à Mountain View, en Californie.
 
De façon très classique pour un moteur, il effectue dans son index des recherches en texte intégral pour trouver celles qui contiennent les mots que vous lui demandez. A priori, rien de très original donc. Mais la suite est peut-être plus astucieuse...
 
En effet, Google, pour réaliser son classement, se sert de la notion d'"indice de popularité" grâce à sa technologie appelée "PageRank". En clair, plus il y aura de pages, dans l'index du moteur, proposant un lien vers le document à classer, meilleur sera le rang de cleui-ci. Cette page est donc dite "populaire", puisque de nombreux sites proposent un lien vers elle. Logique, non ? Imaginez l'indice de popularité des pages d'accueil des sites de Microsoft ou de Netscape...
 
Ce système est utilisé par de nombreux moteurs comme AltaVista, Excite ou Infoseek comme critère d'appoint dans leur algorithme de classement. Il est, en revanche, essentiel et primordial sur Google, qui a même amélioré le système : ce moteur calcule non seulement l'indice de popularité de la page à classer (donc contenant les mots demandés), mais également celui des pages pointant vers elles. En effet, si vous avez un site Web, un lien depuis un site à fort trafic vers vos pages sera bien plus intéressant - pour vous et pour le moteur de recherche - qu'un lien depuis un site faiblement visité (donc moins "populaire"). Plus les sites qui pointent vers vous sont importants, et mieux vos pages seront classées. D'où l'importance de cette notion d'"indice de popularité à deux niveaux". Vous voulez une aspirine ?
 
La notion d'indice de popularité présente néanmoins deux inconvénients majeurs : elle pénalise les pages récentes (donc proposant logiquement peu de liens vers elles) et les pages parlant d'un domaine très pointu, qui ont un indice faible même si elles sont très pertinentes.
 
Tout cela fait de Google un moteur très original et souvent très pertinent dans ses recherches. Il constitue un outil à essayer absolument.
 
Google, dont l'interface est minimaliste et qui propose très peu de publicité sur ses pages de résultats, est aujourd'hui le moteur de recherche majeur du Web avec plus de 50% de parts de marché.

Google est actuellement le moteur dominant du marché des outils de recherche commerciaux généralistes.
Les informations le concernant se trouvent dans une fiche à part : Fenêtre sur Google.
Pour consulter directement les quatre autres sous-ensembles de Google
Google Image Search http://images.google.com
Google Groups http://groups.google.com
Répertoire Google en anglais http://directory.google.com
Google News http://news.google.com
Pour consulter les pages d'information générale de Google
All about Google http://www.google.com/about.html

 

Analyse statistique du moteur de recherche Google
( http://www.searchengineshowdown.com/features/google/dbanalysis.shtml )

in millions

percent

Indexed Web Pages

1,465

73.1%

Unindexed URLs

500

25%

Other file types

35

1.75%

Daily Reindexed Web Pages

3

0.15%

Recherche simple

Minuscules/majuscules

Idem : Google ne tient pas compte de la casse des lettres.

Lettres accentuées

Le mot est toujours recherché tel qu'il est saisi..

OU

OR.  L'opérateur doit être saisi en majuscules obligatoirement.

ET

Opérateur par défaut. Il est également possible d'utiliser le signe + :

SAUF

-.

Expressions

Guillemets.

Troncature

NonIl n'est pas possible de faire des recherches en utilisant la troncature sur Google. le moteur recherche toujours exactement le mot demandé.. L'astérique ne peut pas être utilisé.

Recherche linguistique

Choix dans le menu déroulant sur la page d'accueil.
11 langues sont disponibles. Une zone spécifique permet de définir une page d'accueil configurée avec vos langues favorites.

Recherche sur le nom du site

site:
Exemple : +aspirine +site:www.ucl.ac.be echerchera les documents qui contiennent le mot aspirine et qui sont disponibles sur le site www.ucl.ac.be. Cette fonction ne marche que couplée à un mot clé. Elle n'est pas opérationnelle seule. De plus, l'intitulé complet de l'adresse du site doit être indiqué

Recherche sur les adresses des liens

link: Exemple : link:www.ucl.ac.be trouvera les documents qui contiennent un lien vers une page du site dont l'adresse contient l'expression www.ucl.ac.be. Cette fonctionnalité ne marche pas si un mot clé lui est rajoutée.

Recherche de sites similaires

related:

Recherche directe

Le bouton I'm feeling lucky vous envoie directement vers la page correspondant au premier choix qui aurait été affiché dans la page de résultats.

  

Recherche avancée

Toutes les possibilités de la recherche simple ci-dessus restent valables.

Choix "mot isolé" ou "expressions"

Choix "all the words" ou "exact phrase".

SAUF

Zone "without the words"

Recherche sur les noms de domaine

Zone "Return results from the site or domain".

Recherche linguistique

Zone "Return pages written in...". Menu déroulant proposant 26 choix.

Recherche sur le format des pages

Zone "File Format". Menu déroulant proposant 6 choix (Word, Excel, Powerpoint...).

Recherche sur des zones de la page

Zone "Occurrences". Menu déroulant proposant 4 choix (Titre, texte...).

Nombre de résultats par page

Menu déroulants. Cinq choix proposés : 10, 20, 30, 50 ou 100.

Recherche sur les liens

Zone "Find pages that link to the page...". Identique au link: de la recherche simple.

Recherche sur la date

Zone "Return web pages updated in the". 3 choix possibles (3 mois, 6 mois, un an).

Recherche de pages similaires

Zone "Find pages similar to the page...". Identique au related: de la recherche simple.

     Toute remarque concernant ce site peut être envoyé à Jean CUMPS -
UCL - Faculté de Médecine - Ecole de Pharmacie - TPAO

      Dernière modification : samedi 31 mai 2003