Archive pour le Google catégorie

La toile en vrac - episode 8

Thursday, February 15th, 2007

Comment Google Reader lit-il nos flux RSS?

Saturday, February 3rd, 2007

Depuis que j’utilise Google Reader, je me suis aperçu (et je ne suis pas le seul) que ce dernier pouvait mettre beaucoup de temps avant de s’apercevoir que mon flux RSS avait été mis à jour.

Je m’explique : Lorsque je poste un nouveau billet sur ce blog, il passe en général 3-4h avant qu’il apparaisse dans Google Reader.

En effet tout ceci provient du mode de fonctionnement de Google Reader. Alors que Netvibes, par exemple, vérifie le flux dès qu’un utilisateur affiche la page, Google n’envoie ses Googlebot qu’à intervalle régulier pour vérifier le flux. Il les mets ainsi en cache et les redistribue ensuite aux utilisateurs. Ce qui explique que certains posts n’apparaissent pas immédiatement.

Maintenant que tout le monde à compris je me pose une question :
Sommes-nous tous logés à la même enseigne? Googlebot passe-t-il toujours au même intervalle quel que soit le site Web? Ou Google nous a-t-il concoté un p’tit algorithme dans lequel la fréquence de mise à jour ou le pagerank seraient pris en compte?

Si quelqu’un à des éléments de réponse, ça m’intéresse.

Doit-on tuer Google et rendre sa liberté au Web?

Saturday, January 27th, 2007

Derrière ce titre un tantinet épique et provocateur se cache une réalité du Web : Google contrôle tout. Enfin il essaie de nous faire croire qu’il contrôle mais en réalité ça fait longtemps qu’il n’est qu’un simple observateur.

Pourquoi dis-je cela…C’est simple le contenu du web est créé en fonction des règles dictée par Big G. La course effrénée au pagerank fait perdre la tête à certains…
Je vais citer Emmanuel Parody (Les Echos - ZDNet) :

les nouvelles formes de medias type Engadget.com ou de blogs à thèmes verticaux, avec une production effrenée de billets courts, de copier-coller de communiqués ou de citations de blogs sont la conséquence du modèle économique basé sur les revenus à la performance façon Google Adsense et non l’inverse. Le media s’est adapté à l’environnement.

Et c’est bien ça le problème, le contenu est produit pour et en fonction des moteurs de recherche et non pas pour l’utilisateur. (Et moi qui croyait qu’avec le Web 2.0 c’était l’utilisateur qui était revenu au centre de l’échiquier :? Quel naïf).

Pourtant Google précise bien :

Make pages for users, not for search engines

Mais tout le monde fait le contraire, moi le premier. Pourquoi? Parce que les moteurs de recherche (lire Google) nous apportent la grande majorité de nos lecteurs. Comment refuser les avances de celui qui nous donne tout? Qui peut se vanter de pouvoir se passer de Google? Pas grand monde à mon avis. Alors nous faisons tous pareil et essayons de contenter notre visiteur le plus important, Googlebot.

Mais comme tous les géants, Google a des pieds d’argile et le système qu’il a soigneusement mis en place commence à se retourner contre lui. Cette gangrène qui le ronge c’est le spam (plus précisemment le spamdexing). C’est pourtant lui qui l’a créé (lui et ses acolytes moteurs de recherche). Pourquoi nos blogs sont-ils spammés? Parce que les humains sont vicieux et qu’ils essaient toujours de profiter du système (je ferai un billet plus tard qui aura pour titre “L’homme, à l’origine de la décadence du Web….” ;) ). Les spammeurs essaient d’avoir toujours plus de liens entrants pointant vers leur site pour monter dans “l’estime” de Google.

Et Google n’arrive pas à trouver la solution pour combattre ce fléau. Avouant cet échec il a créé la balise nofollow pour que ses amis webmasters l’aident à faire son job…qu’il n’arrive pas à faire lui même. Mais là encore ce fut inutile puisque le spam continue de se propager à vitesse grand V.

L’algorithme de Google est-il en train de s’auto-détruire? Ils essaient bien de le corriger mais cela sera-t-il suffisant? Nan je pense pas…

La solution : tuer le monstre Google…devenu aussi dangereux pour nous que pour lui-même et rendre au Web l’innocence de sa jeunesse.

Certains me soufflent à l’oreille que c’est impossible, que ca n’apportera rien, au contraire, et que tant qu’on y est, on a qu’à retourner au moyen âge…que même si on tuait Google il y en aurait cent pour le remplacer, que je suis devenu fou, qu’il faut m’enfermer…blablabla

Je range donc mon costume de hippie et m’en vais passer une bonne nuit.

Wikipedia et nofollow, la vrai-fausse solution

Friday, January 26th, 2007

L’encyclopédie en ligne Wikipedia a annoncé il y a quelques jours que tous les liens externes dans Wikipédia seraient désormais équipés de la balise nofollow.

Petit rappel, la balise nofollow fut créée par Google en 2005 pour endiguer le spam sur les blogs. Pour résumer cela revient à dire aux moteurs de recherche

Ne prend pas en compte ce lien dans ton algorithme, je ne le garantis pas…

Le but à l’époque était de décourager les spammeur qui ne pouvaient plus compter sur ces liens pour améliorer leur référencement. Force est de constater que c’est un échec total puisque le spam continue de croître.

Pourquoi alors Wikipedia a choisi cette option? Je n’en sais rien…puisqu’elle est censé combattre un problème (le spam) mais amène également dans ses bagages quelques désagréments.

Wikipedia est très (trop?) bien référencé dans l’index de Google car de nombreux sites font des liens vers des articles de l’encyclopédie. Il est donc très rentable pour son pagerank d’avoir un lien vers son site sur Wikipedia, ça les spammeurs l’ont bien compris.

Le problème est que maintenant tout le monde et pénalisé, le méchant spammeur et le gentil internaute. Plus personne ne bénéficie de l’aura de Wikipedia. Petit exemple simplifié :

Tu découvres une nouvelle fonctionnalité trop-cool-de-la-mort-qui-tue concernant l’iPhone et que personne ne connait (sauf Steve Jobs lui même bien sûr). Tu en parles sur ton blog.
Cette infos est rajouté à la page iPhone de Wikipedia par un contributeurs avec un lien vers ton blog en référence mais ce dernier ne sera jamais suivi par les moteurs de recherche (à cause de la balise nofollow).
Au final Wikipedia, qui bénéficie d’un indice de confiance plus élevé, sortira devant ton site lors des recherches portant sur la fonctionnalité trop-cool-de-la-mort-qu-tue car leur algorithme ne sait pas que le contenu de la page Wikipedia est basé sur ton blog. Et voilou comment Wikipedia s’attribue ta découverte et par la même occasion ton trafic.

Wikipedia devient un site créé et entretenu par une communauté qui désormais ne lui donne plus rien en retour. Certains l’ont un peu en travers de la gorge comme Andy Beal qui propose une campagne contre Wikipedia qui consiste à ajouter la balise nofollow à tous les liens pointant vers l’encyclopédie en ligne pour réduire sa popularité.

Matt (le créateur de Wordpress), lui, annonce simplement que ça ne fonctionnera pas. Et il s’y connaît le bougre puisqu’il a essayé cette solution en l’intégrant dans Wordpress mais cela n’a jamais eu de résultats probants.

Finalement Philipp Lenssen propose une solution intermédiaire que je trouve très élégante et dont le principe est simple : Tous les nouveaux liens ajoutés à Wikipédia reçoivent l’attribut nofollow qui au bout de quelques jours disparaît. Ceci laisse ainsi le temps aux modérateurs et autres contributeurs de supprimer les spams. Pas con. A méditer du côté de chez Wikipédia.

Voici toutes mes sources

Google se recentre sur son vrai métier?

Thursday, January 25th, 2007

youtube and google videoAprès l’acquisition record de Youtube par Google en novembre dernier on pouvait se demander quel serait le futur de Google Video. Je vois mal les deux services cohabiter indéfiniment.

On commence à avoir un début de réponse aujourd’hui. En effet Google Video intègre désormais les vidéos Youtube dans le résultat de ses recherches. Est-ce un premier pas dans la disparition de Google Video? Peut-être…

C’est surtout la mise en oeuvre de la nouvelle politique chez Google instaurée par Sergey Brin il y’a quelques mois qui a pour but de “se recentrer sur le coeur de métier et d’améliorer les fonctionnalités existantes”.

Features, not products

Quel va être le résultat des courses? Un seul service avec Youtube pour la gestion des vidéos et Google pour la recherche et le contenu publicitaire. Nan? Vous en pensez quoi?

Abonnez-vous

Populaires dans 'Google'

Billets récents

XHTMLCSS
Zeo