Comment ça marche : AltaVista ?

Rate this post

moteur de recherche alta vista

 

Flux de confiance

Le programme Trusted Feed permet aux entreprises ayant de grands sites web de soumettre 500 URL ou plus via un flux XML (Extensible Markup Language) directement à l’index d’AltaVista.

Les webmestres ont la possibilité de soumettre des méta-données, y compris des titres, des mots-clés et des descriptions personnalisés pour chaque URL. Les informations soumises dans un flux de confiance remplacent ou supplantent les informations habituellement recueillies par le crawler d’AltaVista.

Bien que le programme Trusted Feed permette aux webmasters d’influencer les composants clés de chaque URL, AltaVista insiste sur le fait que les pages sous-jacentes seront toujours soumises aux mêmes algorithmes de pertinence que toutes les autres pages de l’index. Selon AltaVista, les méta-données contenues dans un Trusted Feed ne sont qu’un des nombreux facteurs utilisés pour calculer la pertinence.

Les clients de Trusted Feed disposent d’outils de reporting complets, conçus pour révéler à la fois le volume de trafic que certaines pages reçoivent d’AltaVista et la provenance du trafic. Des rapports peuvent être générés pour les modèles de trafic global, les requêtes principales, les URL principales, les « clics liés à ce mot », les « clics liés à cette URL » et d’autres types d’informations.

Les rapports peuvent être téléchargés dans des feuilles de calcul Excel pour une analyse plus approfondie. Comme les sites Trusted Feed sont actualisés une fois par semaine, les rapports fourniront un retour d’information précieux aux webmasters, leur permettant de vérifier la position et de modifier les pages pour obtenir un trafic plus important.

Le programme est particulièrement destiné aux sites qui sont traditionnellement difficiles à parcourir, comme ceux qui utilisent des cadres ou du contenu généré dynamiquement. Le programme peut même être utilisé pour soumettre des URL à AltaVista à partir de sites qui bloquent les robots des moteurs de recherche avec le protocole robots.txt.

Le prix du programme Trusted Feed est calculé selon un modèle de coût par clic, variant de 0,15 à 0,60 dollar américain selon la catégorie de contenu. Il y a également une dépense mensuelle minimale pour les prix CPC dans la partie inférieure de la fourchette.

Le programme Trusted Feed permet essentiellement le cloaking, dans la mesure où les pages indexées par AltaVista sont différentes de celles que voit le visiteur humain. Cependant, AltaVista comparera les méta-données de Trusted Feed avec les pages de destination elles-mêmes. Il effectuera également des contrôles ponctuels périodiques des pages, en les comparant aux méta-données de Trusted Feed. Si les pages semblent avoir une signification significativement différente, une pénalité pour spam peut être appliquée.

Par contrat, AltaVista peut également rejeter toute page si un client de Trusted Feed ne respecte pas les politiques d’AltaVista en matière de soumission de sites, qui sont les mêmes pour les webmasters payants et non payants.

 

Index des pages Web : Bon classement

Cette section traite spécifiquement des facteurs qui influencent le classement des pages dans la zone des pages web de la page de résultats d’AltaVista, comme indiqué dans la section Résultats des pages web, ci-dessus.

Facteurs sur la page

Il s’agit de facteurs clés qui se produisent dans le contenu d’une page et qui influencent le classement d’une page pour un terme de recherche particulier :

Le terme apparaît dans le titre de la page web.
Le terme apparaît dans la méta-description et les balises de mots-clés.
Le terme apparaît au début du corps du texte.

Le nombre de termes de recherche présents sur une page et leur proximité sont également pris en compte pour le classement. En général, l’algorithme de classement a été modifié afin de garantir que les pages contenant des phrases exactes recherchées figurent en tête des résultats. Il est également vrai – en général – qu’après cela, les pages contenant TOUS les termes de recherche seront répertoriées, puis les pages contenant N’IMPORTE QUELS des termes. N’oubliez pas qu’au-delà de cela, d’autres facteurs de classement tels que ceux décrits ci-dessus et ci-dessous jouent un rôle.

Boost de la page racine

AltaVista a tendance à mettre davantage l’accent sur la page racine d’un site web (voir Encourager les robots), en particulier en réponse aux recherches par mot-clé et aux recherches populaires.

Analyse des liens

AltaVista utilise l’analyse des liens pour améliorer le classement des pages. La page En savoir plus sur l’analyse des liens explique ce concept de manière plus approfondie et donne des conseils pour obtenir des liens importants afin de renforcer votre réputation dans les systèmes d’analyse des liens.

Spamming

AltaVista peut imposer des pénalités de pertinence ou supprimer complètement des pages de son index web, s’il s’avère que ces pages envoient du spam au service. Ce sont des éléments qu’AltaVista considère comme du spamming :

L’utilisation de texte invisible ou trop petit pour être lu.
Répétition de mots-clés à l’infini, sans raison valable.
Le fait d’induire en erreur sur le contenu d’une page dans la balise de méta description.
Remplir des pages de mots-clés sans rapport avec le contenu réel de la page.
Soumettre des pages identiques ou quasi-identiques, qu’elles proviennent du même site ou de sites miroirs
Historiquement, l’utilisation d’une balise meta refresh avec un réglage de moins de 30 secondes a également entraîné l’abandon de pages pour cause de spam.

Les sanctions pour spam comprennent

Les pages identiques, quasi-identiques, les pages utilisant le meta-refresh, et celles présentant une répétition excessive de mots-clés sont automatiquement exclues de l’index, si elles sont détectées.
Les pages suspectes sont placées sur un rapport, puis examinées par un être humain. Si votre page a été répertoriée dans AltaVista, puis a disparu, il se peut qu’elle ait été considérée comme un spam après examen et qu’elle ait été retirée.
Toutes les pages d’un site peuvent être supprimées et d’autres soumissions bloquées.
Pour signaler un pourriel, vous pouvez utiliser la page ci-dessous (choisissez Rapport de pourriel dans la liste déroulante) :

Sachez également que si vous soumettez des pages en double ou presque, il se peut qu’une seule page soit répertoriée. AltaVista est conçu pour réduire le nombre de pages en double en ne conservant qu’une seule version.

Index des pages Web : Contenu et récupération

Cette section traite spécifiquement des informations qu’AltaVista stocke à partir des pages web qu’il trouve et couvre également la manière dont il interprète les demandes de recherche lorsqu’il extrait des documents de son index.

Contenu enregistré

AltaVista n’indexe pas la ponctuation, donc « guide du webmaster » devient « guide du webmaster ».

Les commentaires ne sont pas indexés.

Seuls les 100 premiers ko de texte d’une page sont indexés. Après cela, seuls les liens sont indexés, jusqu’à un maximum de 4MB. Comme la plupart des pages web sont inférieures à 100K, ces limitations ne devraient pas poser de problème à la plupart des webmasters.

Les pages contenant beaucoup de texte en petite taille peuvent ne pas être indexées. Évitez d’utiliser une taille de police de 2 ou moins comme taille dominante pour votre corps de texte.

AltaVista considère les mots de la méta description et les balises keywords comme des mots supplémentaires sur la page, comme s’ils apparaissaient sur la page dans un texte ordinaire.

Index des pages Web : Format des listes

Le texte de la métabalise description est utilisé pour la description des pages. Si aucune métabalise de description n’existe, AltaVista crée un « résumé » basé sur le texte du corps de la page web. Il peut également utiliser seulement une partie de la balise meta description ainsi que le corps de la page pour former une description. L’article ci-dessous décrit cela plus en détail :

AltaVista permet d’ajouter des « améliorations de la liste », c’est-à-dire des logos, des icônes, des titres ou des liens textuels que vous choisissez. Vous ne pouvez obtenir ces améliorations que pour les pages qui sont soumises par le biais du programme d’inclusion payant d’AltaVista (décrit ci-dessus), et vous devez payer un supplément pour celles-ci.

Détection de la langue

AltaVista classe automatiquement les pages web par langue. Son araignée tente de déterminer la langue d’une page web au moment où elle est parcourue.

Cette technologie est basée sur un dictionnaire. AltaVista examine une page pour voir si la majorité des mots correspondent à ceux d’une langue particulière.

Il n’y a aucun moyen pour un webmaster de spécifier à quelle langue une page doit être assignée, même en utilisant la méta-tagueur Content-Type, comme expliqué sur la page Plus sur les pays et les langues.

AltaVista traduit également le texte qu’il trouve en Unicode, qui peut stocker des caractères pour toutes les langues, et pas seulement pour celles d’Europe occidentale. Cela permet d’avoir un seul index pour servir les utilisateurs du monde entier. Un utilisateur peut effectuer une recherche en anglais, puis une autre en chinois, sans avoir à quitter le service et à se rendre dans une édition exclusivement chinoise.

Détection de porno / Mode de filtrage

AltaVista propose un mode de filtrage à ses utilisateurs. Les pages potentiellement indésirables sont filtrées de trois façons. Premièrement, l’araignée d’AltaVista marque les pages comme étant indésirables si elle trouve certains mots et phrases utilisés de manière particulière. Deuxièmement, le logiciel de recherche utilise un processus de filtrage développé en partenariat avec SurfWatch pour repérer tout ce qui passe le filtre de l’araignée. Enfin, AltaVista permet aux utilisateurs de signaler toute page qui aurait pu passer les deux premiers obstacles, via la page ci-dessous :

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Index