mercredi 3 octobre 2007

Google Sitemap

Présentation de SiteMaps

Google SiteMaps est une initiative de Google pour essayer d'améliorer la façon dont les moteurs de recherche indexent les pages web. Les webmasters qui y participent en plaçant un fichier SiteMap sur leur site permettent à Google de connaître plus facilement les nouvelles pages à indexer, ainsi que la fréquence d'indexation optimale pour les pages déjà dans l'index.

SiteMaps vient en complément du crawl habituel ; il n'est donc pas indispensable d'utiliser ce système pour être indexé dans Google, par contre il peut éventuellement aider à mieux indexer les sites. Pour participer, il suffit de :

  • générer un fichier Sitemap au format spécifié par Google, par exemple en utilisant le générateur fourni par Google (Sitemap Generator) ;
  • mettre à jour ce fichier quand c'est nécessaire (à chaque ajout ou modification de pages).

Intérêt de SiteMaps

Sitemaps peut être utilisé sur n'importe quel type de site, qu'il contienne quelques pages ou des centaines de milliers. Sitemaps est bien évidemment gratuit. Il peut s'avérer utile pour faire connaître rapidement à Google les nouvelles pages ajoutées dans votre site, surtout si elles sont situées en profondeur dans votre site, sans lien depuis la page d'accueil (sans Sitemaps, ce type de page peut mettre du temps à être découverte par Google et donc indexée).

En lançant Sitemaps, Google aborde le problème de l'indexation sous un nouvel angle, en se distingant d'ailleurs de ses concurrents tel Yahoo! qui propose un service (payant) d'indexation de pages dans son index. Même si Google ne garantit pas que les pages indiquées dans le fichier Sitemap seront indexées (contrairement à Yahoo! dont le contrat le garantit sous 48h), on peut aisément penser que Google indexera rapidement ces pages, qui sont plus faciles à "trouver" que par un crawl classique. Yahoo! et les autres moteurs suivront-ils Google ? D'ailleurs ce dernier fournit Google Sitemaps sous licence Creative Commons. Une bonne initiative qui pourrait bien devenir un standard, géré directement par les serveurs web par exemple.

Ou placez vos fichiers Sitemap ?

Un article de Hervé Delvaux (Gérant & Responsable des développements IT de Webadev.com)

Hervé Delvaux, membre de WRI, revient sur un aspect des fichiers Sitemaps : leur emplacement sur le site. Cet article confirme un point précisé dans la FAQ officielle. L'objectif est surtout de donner quelques explications complémentaires sous un angle "pratique".

On peut lire dans la FAQ de Google que les fichiers SiteMaps doivent se placer dans le répertoire que l'on veut indexer.
Si nous plaçons nos fichiers sitemaps directement à la racine : www.mon-site.com/sitemap.xml alors tous les fichiers sitemap et sitemap index se référant à une adresse du type www.mon-site.com/n-importe-quoi seront valides.
Par contre si l'on place ses fichiers Sitemaps dans www.mon-site.com/repertoire/sitemap.xml, si les fichiers sitemaps pointent vers des URL du type : www.mon-site.com ou www.mon-site.com/autre-repertoire/ alors celles-ci seront considérées comme Denied URLs (refusées) et ne seront pas indexées par Google Sitemaps. Seules les URL du type www.mon-site.com/repertoire/n-importe-quoi seront valides (le n-importe-quoi pouvant être un fichier, une page, un répertoire, etc.).

N'étant pas tout à fait convaincu de cette contrainte, nous avons réalisé plusieurs tests.
Ceux qui n'ont posé aucun problème :

  • Plusieurs fichiers sitemap et sitemap index à la racine du répertoire devant être indexé
  • Un seul fichier sitemap à la racine du répertoire devant être indexé
Nous avons également soumis plusieurs sitemaps ainsi que plusieurs sitemaps index dans un répertoire quelconque. Les différentes balises reprises dans ces fichiers pointaient toutes sur des URL du type www.mon-site.com/ma-page.php
Le résultat de ce test est sans appel :
Dans un premier temps Google n'appliquait pas cette contrainte, les différents sitemaps ont été validés sans aucun problème. Mais l'algorithme a certainement été amélioré, les différents sitemaps sont passé d'un statut OK à un Denieds URLs.

Google applique dès à présent ce qui est notifié dans leur FAQ.

Nous pouvons en conclure que le ou les fichiers sitemaps doivent être placés dans le répertoire de plus haut niveau (celui se rapprochant le plus près de la racine).
Le sitemap peut indexer les pages contenues dans le répertoire courant - répertoire du sitemap - ainsi que les différentes pages se trouvant à un niveau inférieur donc dans les sous-répertoires de celui-ci.

Un sitemap placé dans repertoire peut indexer des pages contenues dans les répertoires du type repertoireX, repertoireX-Y, repertoireX-Y-Z ainsi que dans repertoire.

Un sitemap placé dans le repertoire1 ne peut indexer que des pages contenues dans repertoire1-1, repertoire1-2 et repertoire1-3. Il ne pourra donc pas indexer des pages contenues dans repertoire2 (ainsi que ses sous-répertoires) ni dans repertoire.

En ce qui concerne les sitemaps index, même placés à la racine, si ceux-ci pointent vers divers sitemaps (contenant des URL) dans un répertoire quelconque, les sitemaps ne pourront indexer que les pages contenu dans ce répertoire ainsi que ses sous-répertoires.


Tutoriel référencement Flash

La problématique du Flash pour le référencement

Est-il difficile de bien référencer un site en Flash ? Tout dépend des cas ! On distingue 2 types de sites (je schématise) :

  1. tout le contenu du site est intégré dans une seule animation Flash affichée en page d'accueil : dans ce cas le site ne possède qu'une seule page HTML (ou quelques autres pour les contacts ou mentions légales), si bien qu'il n'arrivera jamais à être bien positionné sur un grand nombre de mots-clés. C'est le cas qui pose vraiment problème et pour lequel il n'existe pas (à ma connaissance) de solution optimale... à part se ramener au 2nd cas !
  2. le site utilise intensément des animations Flash sur ses pages, mais l'unité de base de la consultation du site reste la page. C'est pas exemple un site de ecommerce qui sur chaque fiche produit affiche les caractéristiques via une animation Flash. Dans ce cas il n'y a pas vraiment de problème, il suffit de prévoir sur chaque page un contenu alternatif au Flash, qui sera lu par ceux qui n'ont pas de lecteur Flash, et notamment les moteurs de recherche.

Les méthodes

Les méthodes qui suivent donnent une solution pour le 2nd cas, c'est-à-dire fournir un contenu alternatif équivalent à celui de l'animation Flash.

La méthode de la balise noembed

Elle consiste à ajouter du contenu textuel (ou des images...) entre les balises et . L'inconvénient de cette méthode est que la balise noembed n'est pas conforme aux recommandations du W3C (tout comme la balise embed bien entendu).

La méthode SWFObject (JavaScript)

Les explications détaillées sont ici en français et là en anglais pour l'article original.

SWFObject est un petit script JavaScript utilisé pour inclure un contenu Flash dans une page HTML. Le script détecte le plug-in Flash dans tous les principaux navigateurs (sur MAC et PC) et est conçu pour rendre l’intégration des animations SWF aussi simple que possible. L'intégration dans la page est compatible avec les normes HTML et XHTML 1.0 (compatible avec les spécifications futures).

Auparavant, SWFObject s'appelait FlashObject, mais il a dû être renommé pour des raisons de copyright.

Voici un exemple de code :



Ici du texte ou des images pour le contenu alternatif
pris en compte par les moteurs de recherche

Comme vous l'avez compris, il faut :

  • récupérer le fichier swfobject.js sur votre site (dans cet exemple il est à la racine du site)
  • inclure ce JavaScript dans la page qui doit afficher du Flash
  • utiliser une balise div avec comme identifiant flashcontent
  • inclure 2 lignes de JavaScript pour configurer l'animation Flash (source, taille, etc.)

Si le navigateur gère le Flash, l'animation s'affichera à la place de la balise div, sinon c'est le contenu de cette balise qui s'affichera (du texte, des images, ce que vous voulez). Bien entendu les moteurs de recherche tiennent compte du contenu de cette balise div.

Pour configurer votre animation, paramétrez comme il faut la création de l'objet SWFObject en appelant son constructeur SWFObject(swf, id, largeur, hauteur, version, couleur) :

  • swf : le chemin vers le fichier .swf
  • id : l'identifiant de l'objet Flash
  • largeur : largeur de l'animation Flash (en pixels)
  • hauteur : hauteur de l'animation Flash (en pixels)
  • version : le numéro de version Flash
  • couleur : la couleur de fond

Pour télécharger swfobject.js et un exemple d'utilisation de SWFObject, cliquez ici (fichier ZIP).

L'avantage de cette méthode est que sous IE il n'y a plus besoin de cliquer pour activer l'animation Flash (on en parlait lors de la sortie du patch pour le Flash dans IE). D'après ce que je lis souvent, cette méthode est sans doute la plus appréciée aujourd'hui. Dites-moi si je me trompe !

La méthode Flash Satay

Je vous laisse lire les explications ici en français ou bien là en anglais pour l'article original, je n'ai pas testé... Voici un exemple de code :

data="c.swf?path=movie.swf" width="400" height="300">

Ici du texte ou des images pour le contenu alternatif
pris en compte par les moteurs de recherche

Tutoriel Référencement d'images

Optimisation des images pour le référencement

Le positionnement dans Google Images dépend de critères spécifiques à ce moteur de recherche, différents de ceux de l'algorithme classique de la recherche web

Voici quelques uns des principaux critères utilisés par les moteurs pour la recherche d'images :

  • Attribut ALT : remplissez systématiquement l'attribut alt de la balise img en y mettant une description courte de l'image (quelques mots clés). Ne truffez pas cet attribut avec un paragraphe entier ou toute une série de mots-clés à la suite... Egalement, la phrase utilisée pour cet attribut doit réellement correspondre à l'image et au contexte sémantique de l'image (voir les explications ci-dessous).
  • Attribut TITLE : vous pouvez éventuellement remplir l'attribut title de la balise img (à ne pas confondre avec la balise title de la page), en y mettant une (autre) description de l'image. Pour l'instant cet attribut n'est pas pris en compte par les moteurs de recherche, mais vos visiteurs la verront s'ils mettent leur souris au-dessus de votre image.
  • Nom de fichier : Choisissez des bons noms de fichier pour vos images :
    • incluez des mots-clés en rapport avec l'image
    • séparez les mots par un bon séparateur : moi je préfère les tirets (-) au lieu des underscores (_), mais Matt Cutts a annoncé que bientôt Google considérerait aussi les underscores comme des séparateurs... Ne collez pas les mots comme dans centrevilletoulouse, choisissez plutôt centre-ville-toulouse
    • n'utilisez pas de caractères spéciaux ou accentués, ni de majuscules, ça vous évitera des ennuis
    • pour les photos, utilisez le format JPEG, et pour les autres images le format PNG ou GIF
  • Légende : incluez si possible une légende au-dessus ou au-dessous de l'image (ou bien à côté). Les moteurs analysent le contexte sémantique de l'image et se basent entre autres sur cette légende. Profitez-en pour décrire l'image avec des termes légèrement différents de ceux utilisés dans l'attribut alt, tout en restant naturel bien entendu. Mes tests m'ont montré que les moteurs se basent sur les 7 à 10 mots avant et après la balise img : à vous de les soigner pour le référencement !
  • Fichier robots.txt : vérifiez que vous n'avez pas bloqué l'indexation de vos images dans votre fichier robots.txt
  • Intégration d'images dans les articles : quand vous rédigez des articles, surtout s'ils sont destinés à être repris ailleurs (actualités, communiqués de presse, etc.), incluez le plus possible des images.

Voici d'autres critères supposés mais que je n'ai pas personnellement vérifiés :

  • Balise title : mettez dans la balise title de la page hébergeant l'image des mots-clés en rapport avec l'image
  • Balise h1 : mettez dans une balise h1 sur la page hébergeant l'image des mots-clés en rapport avec l'image
  • reste de l'URL : dans le chemin d'accès à l'image (répertoires), utilisez des mots-clés en rapport avec l'image
  • filtre SafeSearch : dans tous les mots-clés, n'incluez aucune référence au sexe, sinon l'image sera filtrée par le filtre parental SafeSearch
  • Backlinks de la page hébergeant l'image : comme pour le référencement classique, faites en sorte d'avoir des mots-clés stratégiques dans les textes des liens pointant vers la page incluant l'image

Exemple de code HTML optimisé pour le référencement des images (le choix des balises p ou div importe peu je pense) :

Ici un paragraphe avec quelques mots-clés dans des phrases bien rédigées.



alt="Petite description avec des mots-clés, destinée aux moteurs et aux mal voyants"
title="Autre description avec des mots-clés, destinée avant tout aux internautes" />

Légende incluant des mots-clés

Remarque : vous pouvez ajouter sur l'image un lien pointant vers une autre page web ou vers une autre version de l'image (par exemple haute résolution).

Optimisation selon les tailles d'images

Google Images permet de chercher des images selon leur taille. Voici des indications sur les tailles qu'il faut utiliser (à peu près) pour cibler les différentes tailles proposées par Google :

  • Petites : 150x150 pixels ou plus petit
  • Moyennes : entre 150x150 et 500x500
  • Grandes : plus grandes que 500x500

Remarque : il semblerait qu'il soit plus efficace en termes de positionnement d'utiliser des images de grande taille.

Autres conseils d'optimisation

  • Si vous utilisez un tableau (balise table), assurez-vous d'inclure des mots-clés dans la même cellule du tableau que celle qui inclut l'image
  • Ne mettez pas de mots clés dans l'attribut alt des images qui servent au design de votre site (et qui n'ont pas de rapport avec ces mots-clés). C'est inefficace et peut être assimilé à du spamdexing.
  • Optimisez le texte du lien qui mène soit à la page web intégrant l'image, soit à l'image elle-même (ce texte de lien doit évidemment contenir des mots-clés)
  • Allez dans votre espace Google pour webmasters, onglet Diagnostic, rubrique Recherche d'images avancée et cochez la case Je souhaite activer la recherche d'images avancée sur mon site et je suis autorisé à utiliser ce service avancé. Si vous choisissez d'activer la recherche d'images avancée, Google utilisera certains outils, notamment le Dispositif Google de libellé des images, pour associer les images de votre site à des libellés et améliorer ainsi le processus d'indexation et la qualité de recherche des images en question. (Notez que vous pourrez désactiver cette option plus tard si vous le voulez).

Google Universal Search

Maintenant que la recherche universelle est de plus en plus présente dans les pages de résultats de recherches classiques (web), il est de plus en plus important d'optimiser le référencement des images, même si le site n'est pas spécialisé dans ce domaine. En effet, si on n'y fait pas assez attention, on risque de perdre 1 place dans la 1ère page de résultats de Google...

Faire indexer ses images dans Google Images

Finalement dans l'optimisation du référencement des images, je me demande si le plus dur n'est pas de les faire indexer ! Contrairement au référencement classique pour lequel c'est très simple de faire indexer rapidement ses pages, l'indexation dans Google Images n'est pas simple :

A propos des images indexées dans Google Images, j'ai retrouvé les chiffres datant de l'époque où Google indiquait le nombre d'images indexées :

  • 9 août 2005 : 2,19 milliards d'images
  • 1er juin 2005 : 1,3 milliard d'images
  • fin janvier 2005 : 1,1 milliard
  • février 2004 : 800 millions
  • avant : 400 millions

Pour savoir combien Google a indexé d'images de votre site, vous pouvez utiliser le même opérateur que pour la recherche classique, à savoir site:example.com. Par exemple à l'heure où j'écris cet article, Google a indexé ~23.500 images du site lemonde.fr. J'espère que le nombre indiqué est plus fiable que celui obtenu pour la recherche classique...

Référencement de forum phpbb

, Google n'aime pas les forums phpbb: il se contente le plus souvent de référencer la page index et semble ne pas noter l'existence des autres....

Pourquoi? Parce que phpbb utilise les pages dynamiques , c'est à dire changeante en fonction du contexte.
Par exemple le fichier viewtopic.php ( les liens sont ceux de phpbb.com )

Alors que le fichier est le même, son contenu est différent selon les paramètres de l'URL. Dans ce cas, selon
t ( qui désigne le numéro du topic dans la base de données ) et start ( qui désigne le numéro du post par lequel doit commencer le topic ).
En conséquence , pour le topic 177077 , qui comporte 500 posts , il y a 500 liens possibles : viewtopic.php?t=177077&start=0 jusqu'à viewtopic.php?t=177077&start=500 .
Et ça pour un seul topic !

Et on peut compliquer: http://www.phpbb.com/phpBB/viewtopic.php?t=177077&postdays=0&postorder=asc&highlight=rabbitoshi&start=440 Cette URL envoit aussi vers le sujet.
Mis bout à bout, le nombre de possibilités devient gigantesque : si Google référençait toutes les combinaisons possible de viewtopic.php sur phpbb.com, cela lui prendrait plus que la totalité des pages déjà indexés dans son répertoire!

En conséquence,
les robots indexeurs de Google se limitent généralement à deux paramètres pour les url.
Ceci est le premier obstacle à l'indexation des pages par Google.

Source

Deuxième problème, le sid ( session identifier ) .
Exemple sur cette url: http://www.phpbb.com/phpBB/faq.php?sid=5394a4ef8c6b471636f8fc49e50a9960.
Alors que faq.php est un fichier sans paramètres dynamiques, phpbb ajoute le sid. Le sid changeant à chaque session, l'url vers la FAQ est différent à chaque visite des robots de Google .
Le nombre de sessions étant quasiment infini, si les bots référençaient de telles url , ils satureraient le moteur de recherche.

Les bots évitent donc l'indexation de ces pages.
Source

Rassurez-vous , il est possible d'améliorer tout ça Smile




» Le session identifier

    » La solution peut paraître simple: le supprimer tout simplement !
    Impossible ! Le sid représente votre session, c'est à dire votre connexion au forum. Sans lui, vous ne seriez plus reconnu et tous les utilisateurs seraient considérés comme non connectés et identiques... Impossible donc d'effectuer des actions comme avoir un profil, poster des messages , et toute autre action individuelle.

    » Par contre, la présence du sid dans les url n'a rien d'obligatoire puisque cette valeur est déjà stockée sous forme de cookies et la session dans la base de données (table phpbb_sessions).
    La valeur dans l'url n'est utilisée que si aucun cookie n'a été créé! (Se référer au fichier includes/sessions.php pour les détails).
    Il est donc possible de supprimer le sid dans les url (et seulement dans les url): vous gardez votre identifiant de session de toute façon .
    A moins que .... votre navigateur n'accepte pas les cookies ... ce qui est le cas des googlebots !

    » Mais nous avons vu plus haut que le sid n'était finalement utile qu'aux utilisateurs connectés, qu'il est indispensable de reconnaitre comme individualités. Or, les robots Google ne se connectent jamais et sont donc toujours invités.
    Conclusion: il faut supprimer le sid dans les url pour les invités !

    » A ma connaissance, le meilleur mod pour faire ceci est Guest Sessions Mod de CyberAlien, qui suit :
    Code:
    #################################################################
    ## MOD Title: Guest Sessions MOD
    ## MOD Version: 0.04
    ## MOD Author: CyberAlien (Vjacheslav Trushkin) http://www.phpbbstyles.com
    ## MOD Description:
    ## This mod removes session id for guests from url and this way
    ## guests who don't have cookies like different robots will use
    ## correct urls. It can be used to allow googlebot and other
    ## search engines to spider your forum correctly.
    ##
    ## Installation Level: Easy
    ## Installation Time: 1-2 Minutes
    ## Files To Edit (1): includes/sessions.php
    ##############################################################
    ## For Security Purposes, Please Check: http://www.phpbb.com/mods/ for the
    ## latest version of this MOD. Downloading this MOD from other sites could cause malicious code
    ## to enter into your phpBB Forum. As such, phpBB will not offer support for MOD's not offered
    ## in our MOD-Database, located at: http://www.phpbb.com/mods/
    ##############################################################
    ## Before Adding This MOD To Your Forum, You Should Back Up All Files Related To This MOD
    ##############################################################

    #
    #-----[ OPEN ]---------------------------------------------
    #
    includes/sessions.php

    #
    #-----[ FIND ]---------------------------------------------
    # around line 157
    $sql = "UPDATE " . SESSIONS_TABLE . "
    SET session_user_id = $user_id, session_start = $current_time, session_time = $current_time, session_page = $page_id, session_logged_in = $login, session_admin = $admin
    WHERE session_id = '" . $session_id . "'
    AND session_ip = '$user_ip'";

    #
    #-----[ REPLACE WITH ]---------------------------------------
    #
    $sql_ip = $user_id == ANONYMOUS ? " AND session_ip = '$user_ip'" : '';
    $sql = "UPDATE " . SESSIONS_TABLE . "
    SET session_ip = '$user_ip', session_start = $current_time, session_time = $current_time, session_page = $page_id, session_logged_in = $login, session_admin = $admin
    WHERE session_id = '" . $session_id . "' $sql_ip
    AND session_user_id = '$user_id'";

    #
    #-----[ FIND ]---------------------------------------------
    # around line 210
    $SID = 'sid=' . $session_id;

    #
    #-----[ REPLACE WITH ]---------------------------------------
    #
    $SID = $user_id > 0 ? 'sid=' . $session_id : '';

    #
    #-----[ FIND ]---------------------------------------------
    # around line 288
    $SID = ($sessionmethod == SESSION_METHOD_GET || defined('IN_ADMIN')) ? 'sid=' . $session_id : '';

    #
    #-----[ REPLACE WITH ]---------------------------------------
    #
    $SID = $userdata['user_id'] > 0 ? (($sessionmethod == SESSION_METHOD_GET || defined('IN_ADMIN')) ? 'sid=' . $session_id : '') : '';

    #
    #-----[ FIND ]---------------------------------------------
    # around line 340
    //
    // If we reach here then no (valid) session exists. So we'll create a new one,
    #
    #-----[ BEFORE, ADD ]---------------------------------------
    #
    elseif(empty($sessiondata))
    {
    // try to login guest
    $sql = "SELECT u.*, s.*
    FROM " . SESSIONS_TABLE . " s, " . USERS_TABLE . " u
    WHERE s.session_ip = '$user_ip'
    AND s.session_user_id = " . ANONYMOUS . "
    AND u.user_id = s.session_user_id
    LIMIT 0, 1";
    if ( !($result = $db->sql_query($sql)) )
    {
    message_die(CRITICAL_ERROR, 'Error doing DB query userdata row fetch', '', __LINE__, __FILE__, $sql);
    }

    $userdata = $db->sql_fetchrow($result);

    if ( isset($userdata['user_id']) )
    {
    if ( $current_time - $userdata['session_time'] > 60 )
    {
    $sql = "UPDATE " . SESSIONS_TABLE . "
    SET session_time = $current_time, session_start = $current_time, session_page = 0
    WHERE session_id = '" . $userdata['session_id'] . "'";
    if ( !$db->sql_query($sql) )
    {
    message_die(CRITICAL_ERROR, 'Error updating sessions table', '', __LINE__, __FILE__, $sql);
    }
    }
    return $userdata;
    }
    }

    #
    #-----[ SAVE/CLOSE ALL FILES ]------------------------------------------
    #
    # EoM

      (Veuillez noter que votre code sera légèrement différent suivant les mods déjà installés ( notamment le mod Last Visit de Niels ) et votre version de phpbb ).


» La réécriture des URL

    » Nous avons vu plus haut que Google n'aimait pas les URL complexes avec plusieurs paramètres. Que cela ne tienne , nous allons donc les réécrire , en language de webmaster , utiliser l'URL REWRITING .
    En quoi cela consiste-t-il? En transformer les URL "à la volée": c'est à dire qu'elles sont modifiées en direct, et non en passant par les fichiers.
    Il est donc possible de garder ce bon viewtopic.php et ses paramètres, nous allons simplement le présenter différemment.
    L'objectif est de transformer: http://www.phpbb.com/phpBB/viewtopic.php?t=154611&start=480 en une url sans paramètres, par exemple topic_154611_480.html. Cette nouvelle url contient les mêmes données mais est simplement présentée différemment !
    Cela se passe en deux étapes :

      Le fichier .htaccess

        Ce brave petit va faire croire que ces deux url sont identiques et renvoyer http://www.phpbb.com/phpBB/topic_154611_480.html vers sa vraie destination , http://www.phpbb.com/phpBB/viewtopic.php?t=154611&start=480 , de manière totalement transparente . Pour tous , l'url sera http://www.phpbb.com/phpBB/topic_154611_480.html.

        » Malheuresement, certains hébergeurs n'autorisent pas les .htaccess, et ceux qui le font peuvent interdire les fonctions dont nous allons avoir besoin.
        Déjà si vous êtes sur un hébergement gratuit, vous pouvez arrêter votre lecture, aucun à ma connaissance n'autorise ceci. Vous pouvez trouver sur ce topic une courte liste des hébergeurs permettant l'utilisation de cette technique .
        Votre hébergeur est dans cette liste? Passons à la suite alors (S'il n'y figure pas , vous pouvez tenter de mettre un fichier .htaccess à la racine de votre site: si lorsque vous accédez à ce dernier, une erreur 500 apparait, c'est que votre hébergeur ne gère pas les .htaccess: supprimez ce fichier) .

        » Que doit comporter ce fichier?
        Et bien toutes les règles de réécriture que vous désirez. Sur la plupart des forums que vous rencontrerez, le fichier .htaccess utilisé est tiré de ce post sur phpbb.com, que nous allons également prendre pour référence.
        Le voici:
        Code:
        RewriteEngine On
        RewriteRule ^forums.* index.php
        RewriteRule ^mforum([0-9]*).* viewforum.php?f=$1&mark=topics
        RewriteRule ^viewforum([0-9]*)-([0-9]*)-([0-9]*).* viewforum.php?f=$1&topicdays=$2&start=$3
        RewriteRule ^forum([0-9]*).* viewforum.php?f=$1
        RewriteRule ^ptopic([0-9]*).* viewtopic.php?t=$1&view=previous
        RewriteRule ^ntopic([0-9]*).* viewtopic.php?t=$1&view=next
        RewriteRule ^stopic([0-9]*)-([0-9]*).* viewtopic.php?t=$1&watch=topic&start=$2
        RewriteRule ^utopic([0-9]*)-([0-9]*).* viewtopic.php?t=$1&unwatch=topic&start=$2
        RewriteRule ^ftopic([0-9]*)-([0-9]*)-([a-zA-Z]*)-([0-9]*).* viewtopic.php?t=$1&postdays=$2&postorder=$3&start=$4
        RewriteRule ^ftopic([0-9]*)-([0-9]*).* viewtopic.php?t=$1&start=$2
        RewriteRule ^ftopic([0-9]*).* viewtopic.php?t=$1
        RewriteRule ^ftopic([0-9]*).html viewtopic.php?t=$1&start=$2&postdays=$3&postorder=$4&highlight=$5
        RewriteRule ^setopic_([0-9]*)-([a-zA-Z0-9]*).* viewtopic.php?t=$1&highlight=$2
        RewriteRule ^sutra([0-9]*).* viewtopic.php?p=$1
        RewriteRule ^newtopic([0-9]*).* viewtopic.php?t=$1&view=newest


        » Si vous êtes hébergé par Sivit ou OVH, vous devez utiliser le .htaccess suivant ( remplacez /forum/ par le chemin relatif vers votre forum ):
        Code:
        RewriteEngine On
        RewriteRule ^forums.* /forum/index.php
        RewriteRule ^mforum([0-9]*).* /forum/viewforum.php?f=$1&mark=topics
        RewriteRule ^viewforum([0-9]*)-([0-9]*)-([0-9]*).* /forum/viewforum.php?f=$1&topicdays=$2&start=$3
        RewriteRule ^forum([0-9]*).* /forum/viewforum.php?f=$1
        RewriteRule ^ptopic([0-9]*).* /forum/viewtopic.php?t=$1&view=previous
        RewriteRule ^ntopic([0-9]*).* /forum/viewtopic.php?t=$1&view=next
        RewriteRule ^stopic([0-9]*)-([0-9]*).* /forum/viewtopic.php?t=$1&watch=topic&start=$2
        RewriteRule ^utopic([0-9]*)-([0-9]*).* /forum/viewtopic.php?t=$1&unwatch=topic&start=$2
        RewriteRule ^ftopic([0-9]*)-([0-9]*)-([a-zA-Z]*)-([0-9]*).* /forum/viewtopic.php?t=$1&postdays=$2&postorder=$3&start=$4
        RewriteRule ^ftopic([0-9]*)-([0-9]*).* /forum/viewtopic.php?t=$1&start=$2
        RewriteRule ^ftopic([0-9]*).* /forum/viewtopic.php?t=$1
        RewriteRule ^ftopic([0-9]*).html /forum/viewtopic.php?t=$1&start=$2&postdays=$3&postorder=$4&highlight=$5
        RewriteRule ^setopic_([0-9]*)-([a-zA-Z0-9]*).* /forum/viewtopic.php?t=$1&highlight=$2
        RewriteRule ^sutra([0-9]*).* /forum/viewtopic.php?p=$1
        RewriteRule ^newtopic([0-9]*).* /forum/viewtopic.php?t=$1&view=newest


        » Pour rappel, ce fichier doit se mettre à la racine de votre forum, et non de votre site.
        Note: Certaines configurations n'autorisent pas l'existence d'un fichier nommé .htaccess ( car ce n'est qu'une extenstion ), dans ce cas, donnez-lui un autre nom puis renommez le une fois sur le FTP.
        Deuxième note: pour les personnes possédant leur propre serveur, il est possible d'activer le module mod_rewrite, je conseille la lecture de cette page aux heureux propriétaires.

        » S'il vous est totalement impossible d'utiliser un .htaccess ou le module mod_rewrite Apache, vous pouvez tenter d'utiliser cette technique qui affiche les variables comme des sous-répertoires. Attention, ceci est en version béta et n'est pas validée par le groupe phpBB! Utilisez le à vos risques et périls.


      Modifications des fichiers du forum

        » Maintenant il faut générerhttp://www.phpbb.com/phpBB/topic_154611_480.html! Sinon cela ne sert à rien de transformer cette URL, puisqu'elle n'est jamais utilisée .
        Pour se faire, il faut cibler les générateurs de pages: includes/page_header.php et includes/page_tail.php.
        Voici les modifications à effectuer:
        Code:
        #
        #-----[ OUVRIR ]------------------------------------------
        #
        includes/page_header.php


        #
        #-----[ TROUVER ]------------------------------------------
        #
        #

        $template->set_filenames(array(
        'overall_header' => ( empty($gen_simple_header) ) ? 'overall_header.tpl' : 'simple_header.tpl')
        );

        #
        #-----[ APRES, AJOUTER ]------------------------------------------
        #
        ob_start();
        function replace_mod_rewrite($s)
        {
        $urlin = array(
        "'(? "'(? "'(?
        "'(? "'(? "'(?"'(?"'(? "'(? "'(? "'(? "'(? "'(?
        $urlout = array(
        "viewforum\\1-\\2-\\3.php",
        "mforum\\1.php",
        "forum\\1.php",

        "ptopic\\1.php",
        "ntopic\\1.php",
        "newtopic\\1.php",
        "stopic\\1-\\2.php",
        "utopic\\1-\\2.php",
        "ftopic\\1-\\2-\\3-\\4.php",
        "ftopic\\1-\\2-\\3-\\4-\\5.php",
        "ftopic\\1-\\2.php",
        "setopic_\\1-\\2.html",
        "ftopic\\1.php",
        "sutra\\1.php");

        $s = preg_replace($urlin, $urlout, $s);

        return $s;
        }

        #
        #-----[ OUVRIR ]------------------------------------------
        #
        includes/page_tail.php

        #
        #-----[ TROUVER ]------------------------------------------
        #
        $db->sql_close();

        #
        #-----[ APRES, AJOUTER ]------------------------------------------
        #

        $contents = ob_get_contents();
        ob_end_clean();
        echo replace_mod_rewrite($contents);
        global $dbg_starttime;


        #
        #-----[ TROUVER ]------------------------------------------
        #
        $gzip_contents = ob_get_contents();
        ob_end_clean();

        #
        #-----[ APRES, AJOUTER ]------------------------------------------
        #


        echo replace_mod_rewrite($contents);
        global $dbg_starttime;

        » Voilà, faites maintenant un tour sur votre forum, vos url ont changées !
        Voici un exemple de forum utilisant exactement ces modifications : http://mods.best-dev.com/, vous aurez les mêmes URL relatives .



    » Quelques mods utiles
    Merci de poser les questions relatives à ces mods dans leur topic



Ne confondez pas faciliter le référencement et le faire: appliquer ses modifications ne fera pas venir les googlebots sur votre forum, il faut les attirer les petits! Vous pouvez lire les conseils du site en lien au début du post, vous en trouverez de nombreux de qualités.

» Pour conclure, pensez surtout au contenu de votre forum, le but n'est pas de faire un forum numéro un sur Google avec deux inscrits...

» Bon référencement à tous Smile

Optimisation des URL de pages dynamiques

Présence de mots-clé dans les URL

Il est préférable d'utiliser des mots-clés stratégiques dans les URL, plutôt que des nombres ou des éléments dénués de sens. En effet, comme je l'avais montré dans un test publié sur WRI, les moteurs tiennent compte de la présence de mots-clés dans les URL. Par contre, ne vous attendez pas à des miracles avec cette optimisation, ce critère étant peu pris en compte. En résumé : si vous le pouvez (aidez-vous de la réécriture d'URL), utilisez des mots ayant du sens dans vos URL.

Tant qu'à faire, évitez d'utiliser dans ces URL certains mots apportant trop peu de sens (les articles par exemple). Mais dans certains cas il est nécessaire d'en garder (soit parce qu'ils sont importants en terme de référencement comme dans La Rochelle ou l'article La est important, soit pour rendre l'URL compréhensible).

Bonus pour AdSense

Si l'URL contient les mots-clés associés à la page, AdSense pourra s'en servir pour mieux cibler les publicités, surtout pour les tout premiers affichages quand la page vient d'être publiée.

Séparateurs de mots dans les URL

Pour séparer correctement les mots dans les URL, il faut utiliser des caractères interprétés comme des séparateurs par les moteurs de recherche. L'espace est déconseillé, mieux vaut utiliser le tiret, la virgule, la barre en biais (/) ou la barre verticale, mais pas le tiret bas (underscore : _). Ne vous fiez pas à la mise en gras de certains mots ou expressions dans les pages de résultats de Google, la gestion de l'affichage des résultats et l'algorithme de classement des résultats sont deux processus distincts. Pour l'instant, MSN Search indexe rarement les pages dont l'URL comporte plus de 2 tirets.

Longueur des URL

La longueur n'est pas un problème pour les moteurs, qui indexent des URL très longues. Par contre, ce n'est pas très pratique à exploiter, par exemple quand une URL est copiée dans un forum ou un blog, elle est souvent tronquée pour éviter de déformer l'affichage. Dans ce cas, les éventuels mots-clés qui la composent risquent de ne pas apparaître. Certains disent qu'il faut se limiter à 255 caractères, ce qui laisse déjà de la marge !

URL multiples

Si une page est accessible à deux URL (ou plus), il y a un risque de contenu dupliqué (duplicate content). Si un même contenu est accessible à plusieurs endroits, les moteurs de recherche tentent de déterminer ce qu'on appelle l'URL canonique, c'est-à-dire l'URL de la page la plus légitime (par exemple celle qui reçoit le plus de liens). Ils n'indexent alors que cette URL canonique, et n'indexent pas les autres (par exemple, Google vient d'améliorer son algorithme à ce sujet depuis la mise en place de BigDaddy). Le problème est qu'il est difficile de prévoir quelle URL va être retenue par les moteurs. Par ailleurs, avoir une page accessible à plusieurs URL est mauvais également en terme de stratégies de liens, puisque l'optimisation s'éparpille sur plusieurs URL plutôt que de se concentrer sur une seule. Voilà pourquoi il faut faire attention de ne pas avoir d'URL multiples pour une page donnée.

A ce propos, comme l'indique SuperPJ dans les commentaires, si on utilise l'URL Rewriting, il ne faut pas oublier de désindexer les pages dynamiques ayant l'ancien format d'URL. Pour cela, il faut utiliser le fichier robots.txt. Dans le cas contraire, une même page sera accessible sur 2 URL ce qui posera des problèmes de duplicate content.

Tutoriel redirection

Utilité d'une bonne redirection

Pour que les robots des moteurs de recherche interprètent correctement la redirection, il faut que l'entête HTTP envoyé avec la page corresponde au statut de cette dernière (l'entête HTTP est envoyé par le serveur web avec chaque page, il contient des informations sur la page utilisées par les navigateurs ou les robots ; pour analyser l'entête HTTP d'une URL, vous pouvez utilisez un outil comme celui-ci : http://www.webrankinfo.com/outils/header.php).

Voici un exemple d'en-tête (pour le site Abondance.com) renvoyé:

HTTP/1.1 200 OK
Date: Mon, 17 Oct 2005 08:51:50 GMT
Server: Apache/1.3.33 (Debian GNU/Linux)
PHP/4.3.10-16 mod_ssl/2.8.22 OpenSSL/0.9.7e
Last-Modified: Mon, 17 Oct 2005 06:48:18 GMT
ETag: "f15dbd-cf2f-43534932"
Accept-Ranges: bytes
Content-Length: 53039
Connection: close
Content-Type: text/html

Le code renvoyé ici a une valeur de 200 (première ligne), signifiant que "tout est OK".

Si une page a changé d'emplacement dans votre site, il faut que l'ancienne URL fasse une redirection vers la nouvelle en utilisant un entête HTTP qui précise que cette page a changé définitivement d'adresse (code 301 ou "redirection permanente"). Cela permettra au robot de ne plus venir indexer l'ancienne URL, et de mettre à jour son index en affectant la nouvelle URL à la page.

Si vous ne mettez pas de redirection depuis l'ancienne URL, le robot obtiendra une erreur 404 et ne sera pas forcément au courant de la nouvelle adresse. Dans ces conditions, vous risquez de rester des mois avec un site mal indexé...
Les différents types de redirection

On distingue deux grandes familles de redirections :

* Les redirections serveur
* Les redirections client

Redirections serveur

Les redirections serveur sont entièrement gérées par le serveur web, et non par le logiciel client (le navigateur). Si vous souhaitez optimiser votre référencement, utilisez uniquement des redirections serveur.

Il existe 2 types de redirection serveur :

* Les redirections définitives ou permanentes (code 301)
* Les redirections temporaires (code 302)

Si vous déplacez une page dans votre site de manière définitive, il faut absolument utiliser une redirection 301. En PHP, vous pouvez par exemple utiliser ce code tout en haut du fichier PHP situé à l'adresse de la page ayant bougé (si vous n'utilisez pas PHP, voir la suite de cet article) :

header("Status: 301 Moved Permanently", false, 301);
header("Location: http://www.votresite.com/
nouvelle-page.htm");
exit();

Remarque : il ne faut pas aller à la ligne comme dans cet exemple où l'URL a été coupée en allant à la ligne pour des questions de mise en page

Les moteurs de recherche interprètent bien cette redirection, et mettent à jour automatiquement leur index en remplaçant l'ancienne URL par la nouvelle.

Si de manière temporaire une page, un répertoire ou même un site est inaccessible (pour maintenance par exemple), il peut être intéressant de définir une redirection vers une autre page (ou site) le temps que la maintenance soit terminée. Dans ce cas, il faut utiliser une redirection de type 302 :

header("Status: 302 Moved Temporarily", false, 302);
header("Location: http://www.votresite.com/
page-temporaire.htm");
exit();

Les moteurs de recherche n'interprètent pas tous cette redirection de la même façon. En règle générale, ils ne suppriment par de leur index la page qui est redirigée ; par contre ils associent à la page cible les caractéristiques de la page de départ. Ceci peut avoir de fâcheuses conséquences puisqu'un webmaster mal intentionné peut mettre en place sur son site une redirection 302 vers une page populaire, attendre que les moteurs considèrent que les 2 URL correspondent à la même page, puis supprimer la redirection pour mettre en place une page standard, bénéficiant alors parfois du PageRank et des backlinks (liens entrants) de la page "piratée".

Ce problème de "page hijacking" est bien connu des référenceurs et des moteurs de recherche. Yahoo utilise depuis l'été 2005 une parade en considérant qu'une redirection 302 entre 2 pages de domaines différents doit être interprétée comme une redirection 301 (ce qui supprime tout intérêt pour les pirates).

De très nombreux webmasters utilisent des redirections 302 en pensant bien faire, alors qu'ils devraient utiliser une redirection 301. C'est le cas par exemple de très nombreux annuaires, qui au lieu de faire des liens "en dur" vers les sites inscrits (un lien en dur est un lien classique et non une redirection), font des redirections 302. Il y a alors parfois des confusions sur certains moteurs entre la page de redirection sur l'annuaire et celle du site inscrit (dans les résultats de recherche, l'URL du site de l'annuaire peut remplacer celle du site inscrit).

Il est déconseillé de s'inscrire dans de tels annuaires, surtout si votre site est récent. Vous pouvez utiliser mon outil de détection des redirections

Redirections client
Redirection par balise META Refresh

La redirection est définie par la balise META http-equiv="Refresh". Elle donne l'ordre au navigateur de rediriger l'internaute vers une URL spécifiée au bout d'un certain nombre de secondes.

Exemple (redirection vers la page "nouvelle-page.html" au bout de 5 secondes) :


Pour le référencement : il ne faut pas l'utiliser ! En effet, cette balise a trop souvent été utilisée en fixant le nombre de secondes à zéro, en général pour faire une page satellite. A proscrire si possible (nous avons rarement eu vent de problèmes liés à l'utilisation de ce type de redirection, mais il est de toutes façons préférable de passer par une redirection de type 301).
Redirection JavaScript (ou tout autre langage côté client)

La redirection est définie par une fonction JavaScript qui modifie l'URL de la page à afficher, sans modifier l'entête HTTP.

Exemple :


Pour le référencement : il ne faut pas l'utiliser ! Les robots ignorent le JavaScript, ils ne suivront donc pas une telle redirection. D'autre part, ce type de redirection est également souvent le "signe" d'une page satellite, technique de plus en plus dangereuse en rapport à la "chasse au spam" des moteurs. A ne surtout pas utiliser donc !
Cas des pages ayant disparu de manière définitive

Si vous supprimez une page sur votre site mais que vous n'avez pas de nouvelle page qui la remplace, vous avez le choix entre deux options :

1. Soit faire supprimer définitivement cette page de l'index des moteurs.
2. Soit rediriger cette page vers une page d'explication (ou la page d'accueil du site).

Pour supprimer une page définitivement, le plus simple est de renvoyer un code HTTP 410 ("ressource plus disponible"). Si vous ne faites rien de spécial, un code 404 sera renvoyé, et les robots reviendront pendant longtemps voir si cette page est toujours introuvable (code 404). En PHP, vous pouvez par exemple utiliser ce code tout en haut du fichier PHP situé à l'adresse de la page supprimée :

header("Status: 410 Gone", false, 410);
exit();

Ou, pour rediriger une page supprimée vers une page d'explications :

header("Status: 301 Moved Permanently", false, 301);
header("Location: http://www.votresite.com/
explications.htm");
exit();

Utiliser des directives sur le serveur

Ecrire un petit code PHP au début de chaque page supprimée ou déplacée peut vite devenir fastidieux. Il est donc souvent plus efficace de définir les redirections directement sur le serveur., au travers d'un fichier nommé ".htaccess". Voici quelques exemples pour le serveur Apache (notez qu'il faut mettre un ou plusieurs espaces entre la directive, la page à rediriger et la page redirigée, et qu'il ne faut pas aller à la ligne) :

Rediriger de manière définitive la page /test/actu.html vers la page /actualites/index.html :

RedirectPermanent /test/actu.html
http://www.votresite.com/actualites/index.html

Rediriger de manière définitive le répertoire /articles (et toutes ses pages) vers le répertoire /actualites/articles/ :

RedirectPermanent /articles
http://www.votresite.com/actualites/articles

Autre façon de faire :

RewriteRule /articles /actualites/articles [R=301]

Rediriger de manière temporaire le répertoire /outils vers la page /maintenance.htm :

RewriteRule /outils /maintenance.htm [R=302]

Rediriger de manière définitive le répertoire /archives vers le site http://www.mes-archives.net/ :

RedirectPermanent /archives
http://www.mes-archives.net/

Définir une page d'erreur 404 personnalisée :

ErrorDocument 404 /erreur-404.php

Attention, ne mettez surtout pas une adresse commençant par http sinon le code serait 302 au lieu de 404. Le code suivant n'est pas bon :

ErrorDocument 404
http://www.votre-site.com/erreur-404.php

Le plus simple est ensuite d'insérer ces lignes dans un fichier nommé .htaccess situé à la racine de votre site.

Vous pouvez également utiliser un fichier .htaccess dans chaque répertoire, et n'y indiquer que ce qui concerne le répertoire en question (et éventuellement ses sous-répertoires).

Attention : le nom de ce fichier est particulier : il n'a pas de nom mais uniquement une extension (si on raisonne avec la logique Windows…). Pour créer ce fichier, ouvrez un éditeur de texte (Notepad fera l'affaire) et enregistrez-le sous le nom htaccess.txt ; ensuite, une fois que vous l'aurez transféré par FTP sur votre site, utilisez le logiciel de FTP pour le renommer en .htaccess uniquement.

Attention également : en cas d'erreur de syntaxe à l'intérieur du fichier, vous pouvez bloquer entièrement votre serveur (erreur 500). Dans ce cas le mieux est d'annuler les derniers changements, de remettre en ligne l'ancien fichier .htaccess et de réfléchir à ce qui peut causer problème.

Si vous avez accès au serveur (serveur dédié et non mutualisé), il est possible de définir ces directives dans le fichier de configuration d'Apache directement (httpd.conf) ; ceci dépasse le cadre de cet article et ne sera donc pas détaillé ici.
Conclusion

Un site web est en perpétuelle mutation. Il est quasiment certain qu'un jour ou l'autre vos pages web changent d'adresse ou disparaissent. Pour ne pas perdre le bénéfice d'un référencement, vous devrez absolument prendre en compte ces redirections et signaler aux moteurs de recherche la nouvelle situation. Tout devrait alors bien se passer si vous utilisez notamment les redirections 301 à bon escient, comme indiqué dans cet article. Votre situation, en termes de référencement, ne devrait pas en pâtir et la transition s'effectuer en douceur... Raison de plus pour apporter le plus grand soin à cette procédure...

Référencement d'un blog

Optimiser le blog lui-même

Comme tout site web, vous devez optimiser son architecture :

  • Choisissez soigneusement vos titres (avec des mots-clés)
  • Utilisez les différentes balises servant à structurer le contenu sur la page (notamment

    ,

    ...

    ) et à mettre en avant certains mots (par exemple en gras ou italique avec , , ou ).
  • Choisissez un format d'URL le plus simple possible, court, avec des mots-clés séparés par des tirets (ou des virgules, des points, des barres obliques mais pas des underscores). Pour cela vous aurez sans doute besoin de l'URL Rewriting. Matt Cutts conseille de ne pas s'embarrasser avec des dates dans les URL...
  • Utilisez dans vos articles les expressions-clés que vous avez jugées stratégiques pour votre site.
  • Dans vos articles, ne soyez surtout pas avare en liens sortants externes. C'est un très bon moyen d'en recevoir naturellement vous aussi.
  • Ne tombez pas dans les pièges du duplicate content

Si vous avez d'autres idées, merci de me les indiquer !

En tant que blog, pensez aussi à ceci :

  • Mettez en avant le flux et facilitez les moyens de s'y abonner. Il existe désormais des icônes officielles pour symboliser le flux (cf. page d'accueil de WRI). Testez cet outil pour créer des boutons d'abonnement aux flus via les principaux outils.
  • N'oubliez pas de prévoir une balise dans vos pages qui fasse référence à votre flux, afin de permettre aux navigateurs ou aux outils spécialisés de détecter le(s) flux associé(s) à votre site. Firefox et Internet Explorer 7 les détectent (et affichent le logo du flux) et sans doute aussi d'autres navigateurs...
  • Utilisez une feuille de styles XSL pour votre flux afin de rendre votre flux visible par tous (comme ici)
  • Proposez plusieurs flux (articles, commentaires, par catégorie, etc.)
  • Dans vos flux, mettez un nombre important d'articles, par exemple 20
  • Faites-vous connaître de la blogosphère en tissant des liens avec d'autres blogs de votre domaine d'activité (installez un blogroll).
  • Mettez en évidence l'URL permanente de chaque billet.
  • Proposez à vos lecteurs d'ajouter votre billet dans leurs outils de bookmarks sociaux comme del.ico.us
  • Proposez à vos lecteurs de voter pour votre billet dans leurs outils du type Digg (en France on pourrait citer AllActu, Fuzz, Scoopeo, TapeMoi ou Wikio)
  • Ajoutez des tags à vos billets (ainsi qu'un nuage de tags si vous aimez ça)
  • Définissez vos articles principaux en tant que référence. Ces articles sont listés sur la page d'accueil (ou toutes les pages) de votre blog, et sont donc mis en avant (meilleur PageRank)

Si vous avez d'autres idées, merci de me les indiquer !

Commentaires et trackbacks

Faites des commentaires (pertinents) dans d'autres blogs de votre domaine d'activité. Même si la plupart des liens que vous gagnerez ainsi ne vous aideront pas pour le référencement (à cause de leur attribut nofollow), vous vous ferez connaître dans la blogosphère et vous obtiendrez également du trafic.

Quand vous citez d'autres blogs (en leur faisant un lien...) assurez-vous que votre outil de blog leur envoie un ping de trackback, pour les mêmes raisons que celles évoquées précédemment.

Faire connaître son blog dans les outils spécialisés

Comme tout site web, il faut l'inscrire dans des annuaires ou moteurs de recherche. Certains de ces outils de recherche sont spécifiquement réservés aux blogs alors profitez-en ! Quelques pistes :

Pour informer d'autres sites que vous venez de publier un nouveau billet dans votre blog, il faut envoyer un ping. Certains sites proposent d'envoyer un ping à toute une série de sites d'un seul coup, ce qui fait gagner du temps. Voici mes préférés :

Je rentre dans les détails plus loin dans cet article, dans les parties spécifiques à Dotclear et WordPress.

Si vous connaissez d'autres outils, notamment des francophones, merci de me les indiquer !

Mesurer les performances

Pour savoir si votre flux est lu par beaucoup de monde, et quel trafic il vous génère, il vous faut des outils spécialisés. Certains outils de mesure d'audience proposent d'analyser le trafic de votre flux (c'est le cas par exemple de XiTi), mais vous pouvez utiliser également des outils spécifiques comme :

Le seul inconvénient important de ces outils est que votre flux est géré en dehors de votre site, alors qu'il est préférable d'avoir un flux dont l'URL fait partie de votre nom de domaine.

Pour savoir si votre blog est bien positionné dans les moteurs de recherche, là aussi c'est comme pour les sites classiques, il vous faut un logiciel d'analyse du positionnement. Vous pouvez essayer AgentWebRanking, leader francophone, celui que j'utilise : je vous offre un test gratuit complet pendant 15 jours.

Si vous connaissez d'autres outils, notamment des francophones, merci de me les indiquer !

Optimiser son référencement avec un blog Dotclear

L'URL Rewriting n'est pas indispensable puisque par défaut les URL sont indexables et contiennent des mots-clés relatifs au billet. Cette technique permet simplement de personnaliser (et simplifier) le format des URL.


Liste de plugins utiles (voir ici la liste fournie par Dotclear) :

Pour améliorer le plugin d'envoi de pings (qui est assez limité dans sa version de base), mettez à jour la liste dans le fichier /ecrire/ping/index.php :

$ping_sites = array(
'bblog.com' => array('bblog.com','/ping.php',array($objPing,'weblogPing')),
'bitacoras.com' => array('ping.bitacoras.com','/',array($objPing,'weblogPing')),
'blog.goo.ne.jp' => array('blog.goo.ne.jp','/XMLRPC',array($objPing,'weblogPing')),
'blogbuzzmachine.com' => array('rpc.blogbuzzmachine.com','/RPC2',array($objPing,'weblogPing')),
'blogdigger.com' => array('www.blogdigger.com','/RPC2',array($objPing,'weblogPing')),
'blogmura.jp' => array('ping.blogmura.jp','/rpc/',array($objPing,'weblogPing')),
'blogoon.net' => array('www.blogoon.net','/ping/',array($objPing,'weblogPing')),
'blogpeople.net' => array('www.blogpeople.net','/servlet/weblogUpdates',array($objPing,'weblogPing')),
'BlogStyle' => array('blogstyle.jp','/xmlrpc/',array($objPing,'weblogPing')),
'BulkFeeds' => array('bulkfeeds.net','/rpc',array($objPing,'weblogPing')),
'cocolog-nifty.com' => array('ping.cocolog-nifty.com','/xmlrpc',array($objPing,'weblogPing')),
'feedburner.com' => array('ping.feedburner.com','/',array($objPing,'weblogPing')),
'holycowdude.com' => array('www.holycowdude.com','/rpc/ping/',array($objPing,'weblogPing')),
'Google.com' => array('blogsearch.google.com','/ping/RPC2',array($objPing,'weblogPing')),
'Joueb.com' => array('joueb.com','/cgi-bin/rpc.pl',array($objPing,'weblogPing')),
'Moreover.com' => array('api.moreover.com','/RPC2',array($objPing,'weblogPing')),
'myblog.jp' => array('ping.myblog.jp','/',array($objPing,'weblogPing')),
'pubsub.com' => array('xping.pubsub.com','/ping/',array($objPing,'weblogPing')),
'syndic8.com' => array('ping.syndic8.com','/xmlrpc.php',array($objPing,'weblogPing')),
'technorati.com' => array('rpc.technorati.com','/rpc/ping',array($objPing,'weblogPing')),
'Technorati.jp' => array('rpc.technorati.jp','/rpc/ping',array($objPing,'weblogPing')),
'topicexchange.com' => array('topicexchange.com','/RPC2',array($objPing,'weblogPing')),
'vizibox.com' => array('www.vizibox.com','/ping/ping.php',array($objPing,'weblogPing')),
'weblogalot.com' => array('ping.weblogalot.com','/rpc.php',array($objPing,'weblogPing')),
'Weblogs.com' => array('rpc.weblogs.com','/RPC2',array($objPing,'weblogPing'))
);

N'oubliez pas que ce plugin n'est pas entièrement automatisé : c'est à vous de déclencher l'envoi de pings après chaque publication d'articles (heureusement, un seul clic suffit).

Si vous connaissez d'autres plugins, merci de me les indiquer !

Optimiser son référencement avec un blog WordPress

Liste de plugins utiles :