Obama i el robots.txt de la Casa Blanca

S'ha parlant molt sobre com Barack Obama ha aprofitat internet per donar a conèixer la seva candidatura i per aconseguir mobilitzar votants. També s'ha comentat en molts blocs l'ambiciós pla tecnològic d'Obama per als EUA (pot llegir-se aquí).

Però una de les coses que m'ha cridat més l'atenció i que poques persones han advertit: el canvi que ha patit el robots.txt de la pàgina web de la Casa Blanca, molt en línia amb el que Obama predica.

Què és un robots.txt?

És un arxiu de text que conté instruccions sobre les pàgines visitables i les no visitables pels Robots, d'una pàgina web. És a dir, indica quines parts de la pàgina web no han de ser escanejades pels robots.

Normalment, es tracta de contingut que apareix a la pàgina web, però només es desitja que sigui accessible a la gent que navega per la web, no es vol que aquest contingut aparegui indexat en els cercadors. També s'utilitza quan un gestor de continguts genera contingut duplicat i per tant, penalitzat pels cercadors.

Aquest fitxer es crea seguint les instruccions que podem trobar aquí: robots, I tots els robots que segueixen el "Protocol d'Exclusió de Robots"Es comprometen a fer cas d'aquestes instruccions.

Si una pàgina web no té creat aquest arxiu de text, els robots entenen que poden indexar-(encara que en haver buscat el robots.txt d'aquesta pàgina els robots generen un error 404 i per tant, és recomanable que es creï una pàgina en blanc i es pugi per FTP amb el nom de robots.txt perquè d'aquesta manera, els 404 que es generin a la pàgina seran reals i puguin ser depurats pel webmaster).

Tornem a l'robots.txt de la Casa Blanca

Fins fa uns dies, quan explicava a classe què és un arxiu robots.txt i què és el "Protocol Exclusió de Robots"Posava diversos exemples per il·lustrar els diferents tipus de robots.txt que podem crear per donar instruccions als robots indexadors:

  • Una pàgina robots.txt en blanc
  • Una pàgina robots.txt amb instruccions més o menys "normals"
  • Una pàgina robots.txt totalment exagerada i fora de lloc.

Doncs bé ... Obama m'ha "sabotejat"Els exemples i s'ha carregat el meu exemple de mala praxi en qüestió de robots.txt: El webmaster de la nova pàgina web de la Casa Blanca ha creat un nou robots.txt perfectament realitzat, clar i concís.

El webmaster de George Bush Jr., havia creat un robots.txt amb milers i milers de pàgines amb l'accés prohibit als robots. Ni dir cal que ... no hi havia res interessant en aquest contingut (alguna vegada m'havia dedicat a anar llegint el que no volien que fos indexat ... fotos de la first lady, discursos, etc ...). Però mostrava bé que els de la Casa Blanca tenien un concepte una mica arcaic del que és internet i sobre la publicació de contingut.

El nou websmaster, en aquest sentit, mostra tenir molt més clar el que ha de ser la pàgina web d'una institució com la Casa Blanca.

Val ... però com era aquest robots.txt?

Per sort, en les diapositives de les meves classes sempre incloc pantallazos sobre el que explico, no sigui que em falli la connexió a internet o que allà on doni la classe no tinguin connexió ... (què trist haver de pensar sempre en aquesta possibilitat).

Així que sota aquestes línies (al final del post) incloc la imatge que tinc arxivada i que ara ja passa a ser història ... (Observa la barra de scroll del pantallazo... és la que mostra la magnitud del llistat)

La pàgina robots.txt actual la pots veure clicant aquí: Robots.txt de la Casablanca amb Obama .

Si vols més informació sobre com crear un robots.txt o per a què serveix, la trobaràs aquí: robots.txt i també en el Curs Gratuït de Posicionament en Cercadors de la nostra pàgina web: Curs de Posicionament en Cercadors

Robots.txt de Casablanca

0 respostes

Deixa una resposta

Vols unir-te a la conversa?
No dubtis a contribuir!

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *