Articles sobre Posicionament en Cercadors.

I Taula rodona en cercadors web: màrqueting i posicionament en cercadors

El proper dimarts 28 d'octubre, a les 18:30, se celebrarà a l'Auditori de l'edifici Rambla de la Universitat Pompeu Fabra (Rambla 32, Barcelona), la presentació d'una nova edició del Màster en Posicionament en Cercadors i Màrqueting Digital, així com una taula rodona sobre Cercadors web.

Tinc el plaer de compartir taula rodona amb Fernando Macià de Nivell de Comunicacions humans, Que parlarà de SEO i amb Cristòfol Rovira del Grup de Recerca DigiDoc de la UPF que parlarà de formació i investigació en cercadors. Jo parlaré de SEM (Màrqueting en Cercadors) i explicaré "Les 6 tècniques que ens ajudaran a optimitzar el nostre pressupost de màrqueting en cercadors".

Cada un de nosaltres presentarà la seva visió sobre els cercadors i compartirem experiències relacionades amb la intel·ligència de mercat, l'estratègia de continguts i el posicionament de marca.

Al final de les ponències s'obrirà un debat en el qual els assistents podran plantejar les seves preguntes.

Penso que serà un acte interessant, tant perquè els tres punts de vista i les aproximacions als cercadors dels tres ponents són molt diferents, com perquè no és de cada dia que es pot escoltar a Fernando Macià i a Cristòfol Rovira. Estic segura que jo mateixa aprendré un munt de coses noves. A més, com el Màster és online, és una oportunitat molt bona per conèixer als alumnes que assisteixin a l'acte, d'aquesta manera, quan parlem amb ells en els fòrums de debat els podrem posar cara ... que és una cosa que sempre trobo a faltar en aquest tipus de formació.

Ens veiem!

Més informació sobre l'acte: Taula Rodona de Posicionament en Cercadors

Aquesta és la presentació amb la qual vaig il·lustrar la meva xerrada:

Ens parlem.

Google actualitza el valor PageRank seva barra

El passat 30 d'abril Google va actualitzar el PageRank que ens mostra a la barra d'eines. Aquesta és la segona actualització del 2008. La següent actualització s'espera per a finals de setembre.

Què és el PageRank i quina importància té en l'algoritme d'ordenació de resultats?

El PageRank és l'algorisme que Google utilitza per donar un valor numèric a la importància que té una pàgina web. Aquest valor l'utilitza com a part de l'algorisme que marca l'ordre en què es mostren els resultats d'una cerca a Google.

El PageRank es diu així en honor al seu creador Larry Page. PageRank no significa "rànquing de pàgines".

La finalitat de PageRank és assignar un valor numèric a les pàgines web segons el nombre de vegades que altres pàgines les recomanen i segons el PageRank que tinguin aquestes pàgines. És a dir, estableix la importància d'aquesta pàgina web.

Al llarg d'aquests anys Google ha anat modificant aquest algoritme amb l'objectiu de neutralitzar algunes trampes realitzades per a administradors web que volen modificar el seu posicionament de forma fraudulenta. En aquesta última actualització sembla que també ha modificat l'algoritme ja que nombroses pàgines web han baixat el seu PageRank ... encara que, per sort, moltes ho han pujat, entre elles les d'alguns dels nostres clients.

Com funcionen les actualitzacions ?: diferència entre el PageRank real i el PageRank de la barra de Google

El PageRank que ens mostra la barra de Google només s'actualitza un cop cada 4 mesos, aproximadament.

La barra ens mostra un PageRank en base 10 en una escala logarítmica. És a dir, és fàcil pujar de 0 a 1 o de 2 a 3, però en canvi és molt difícil pujar de 5 a 6, i encara més pujar de 6 a 7. Però aquest no és el PageRank real de la nostra pàgina, sinó el valor que Google li va assignar l'última vegada que va actualitzar el PageRank de la barra.

Durant 2007 hi va haver 3 actualitzacions de PageRank a la barra de Google: al gener, a l'abril i al final de setembre. Les previsions per aquest any són les mateixes: esperem 3 actualitzacions.

El PageRank que utilitza Google per als seus càlculs és molt més precís i utilitza una escala molt més gran, encara que no sabem quant, ia Google hi ha un hermetisme complet sobre això, encara que sembla que és en base 100. Els seus servidors interns el s'actualitzen diàriament.

Quan serà la propera actualització?

Si tot segueix el seu curs, hauríem esperar-la durant el mes de setembre. Així que totes les accions per pujar el PageRank que portem a terme a partir d'ara, no es veuran reflectides a la barra de Google fins a aquest mes.

Això no vol dir que abans de setembre, les nostres accions no serveixin per a res. Res més lluny de la realitat. Recordem que Google treballa amb un PageRank a temps real.

En la meva barra de Google no veig el PageRank, què he de fer?

Per defecte, la barra de Google no inclou aquesta informació, però des de les opcions de la barra podràs incloure PageRank, i d'aquesta manera, mentre navegues per la xarxa podràs conèixer els PageRank de les pàgines que visites. Això t'ajudarà a saber en quines pàgines web hauries intentar incloure els teus enllaços perquè augmenti el teu PageRank.

Enllaços d'interès:

Com puc millorar el PageRank de la meva pàgina web ?:
http://www.geamarketing.com/posicionamiento/mas_pagerank.php

Curs Online gratuït de Posicionament en Cercadors:
http://www.geamarketing.com/posicionamiento_buscadores.php

AJAX, una tècnica a utilitzar amb moderació

En aquest article expliquem què és el AJAX, quan ha d'usar-i què contraindicacions té. També mostrem com esmenar algunes de les contraindicacions.

Què és el AJAX?

Les sigles AJAX signifiquen: Asynchronous JavaScript And XML. És a dir, la combinació de JavaScript i XML de manera asincrònica.

És una tècnica desenvolupada per a aplicacions web interactives, que consisteix en fer que un conjunt de tres tecnologies ja existents treballin juntes, de manera efectiva.

Aquestes tecnologies són:

  1. (X) HTML i CSS (Fulles d'Estil en Cascada), per donar una estructura i presentar la informació en la pàgina web.
  2. JavaScript, Utilitzat per a la interacció dinàmica amb les dades.
  3. XML, Utilitzat per a la interacció amb el lloc web. Tot i que no és simpre necessari utilitzar XML amb les aplicacions AJAX, ja que per exemple, amb fitxers de text pla també es pot emmagatzemar la informació.

Igual que el DHTML, AJAX no és de per si una tecnologia web independent, sinó un terme que abasta les tres tecnologies abans esmentades.

Per a què serveix l'Ajax?

L'Ajax serveix per efectuar canvis en una pàgina web, a voluntat de l'usuari, sense haver de recarregar tota la pàgina de nou.

Per exemple, en una pàgina web l'usuari sol·licita alguna informació que és oferta des de la mateixa pàgina web (com veure la descripció d'un producte) i en prémer sobre l'enllaç, a la mateixa pàgina (sense carregar-la de nou) apareix la informació sol·licitada .

El procés de mostrar les dades realitzat en HTML íntegrament consumiria bastant ample de banda, ja que tot l'HTML hauria de tornar a ser carregat per només mostrar els canvis efectuats. En canvi, amb una aplicació AJAX és molt més ràpid i no consumeix ample de banda.

El JavaScript utilitzat en l'aplicació AJAX és un llenguatge dinàmic, capaç d'efectuar canvis en una pàgina web sense necessitat de re-carregar-la. AJAX s'assegura que només la informació necessària sigui sol·licitada i processada, emprant SOAP o un altre llenguatge de serveis web basat lleugerament en XML.

D'aquí que a nivell tècnic, s'obtinguin 3 avantatges: un temps de càrrega molt menor, estalvi de l'ample de banda de l'usuari i càrrega molt menor del servidor on està allotjada la web.

Els problemes d'AJAX

Problemes amb la indexació en cercadors:

AJAX és utilitzat per Google, Yahoo, Amazon i una infinitat més de cercadors, portals i creadors de contingut, però no l'utilitzen de forma general i massiva tal com alguns pensen. Google, per exemple, que dóna suport que els administradors web utilitzen AJAX en les seves programacions, l'utilitza ell mateix en GMail, a Google Suggest, a Google Maps, però no en absolutament totes les seves pàgines web.

El problema amb AJAX és que el contingut que es mostra dins de l'aplicació que utilitza AJAX, no s'indexa en els cercadors. Això és així perquè les aranyes (spiders) dels cercadors no són capaços d'interactuar amb l'aplicació AJAX i aconseguir que s'activi la comanda que mostra el contingut.

D'aquí que sigui una mala idea per exemple, crear un llistat amb el nom dels nostres productes i fer que amb una aplicació AJAX en prémer sobre un nom de producte, es mostri la descripció del producte i la seva fotografia, a la dreta del llistat. Si fem això, les descripcions dels productes i les seves imatges no quedaran indexades ni a Google ni en qualsevol altre cercador.

Encara que no tot són males notícies, certes formes de treballar amb AJAX sí que indexen, per exemple, les que juguen a mostrar o no mostrar continguts utilitzant marges positius i negatius. Així que només cal que tinguem en compte a l'hora de programar si les aranyes poden passar o no podran passar.

Problemes amb l'accessibilitat:

Si partim de la base que les nostres pàgines web haurien de ser sempre accessibles a tot tipus de navegadors i d'usuaris i almenys haurien de complir l'estàndard A del W3C (http://www.w3.org), Ens trobem en que la major part d'scripts que milloren aparença i la interactivitat d'una pàgina web tenen problemes d'accessibilitat. El AJAX també els té.

Com hem vist a l'inici d'aquest article, la utilització d'AJAX implica la utilització de JavaScript, i alguns navegadors no suporten aquest tipus de programació. Encara que com veurem més endavant això té solució.

Però tinguem en compte que una gran part de les aplicacions AJAX que trobarem a les llibreries que hi ha a Internet no han esmenat aquest problema i per tant, són aplicacions que no compleixen els estàndards W3C (al final d'aquestes línies oferim enllaços a llibreries de codi ja articles que tracten el tema de l'accessibilitat i AJAX).

AJAX, a fer servir amb moderació

Tal com hem vist en l'apartat anterior, tot i que les aplicacions AJAX aporten dinamisme, interactivitat i reducció d'ample de banda a una pàgina web, també tenen inconvenients a nivell d'indexació en cercadors i a nivell d'accessibilitat. Per tant, hem de tenir en compte i neutralitzar el següent:

  1. Si utilitzem AJAX a les nostres pàgines web, hem de ser conscients que el contingut que es mostri dins de l'aplicació AJAX no serà indexat pels cercadors. Per esmenar aquest detall, podem crear aquest contingut de forma redundant i fer-lo accessible a les aranyes a través d'un mapa del web o mitjançant enllaços al peu de pàgina de la web.
  2. Si utilitzem AJAX per fer més interactiva la nostra pàgina, hem de tenir en compte que no complirem el nivell A d'accessibilitat, llevat que utilitzem les llibreries de codi aprovades pel W3C o mitjans per a navegar per la web sense necessitat d'utilitzar JavaScript.

Enllaços relacionats

Nova informació sobre la indexació d'AJAX a Google (març 2010): http://code.google.com/intl/es/web/ajaxcrawling/

Exemples de pàgines web que utilitzen AJAX i llibreries amb codi AJAX per ser utilitzades per a administradors web:
http://ajaxpatterns.org/Ajax_Examples

Articles on s'explica com aconseguir codi AJAX que sí que compleix amb el nivell A d'accessibilitat del W3C:
http://www.maxkiesler.com/

Llistat amb errors comuns d'accessibilitat:
http://www.w3.org/TR/WCAG20-SCRIPT-TECHS/#N11799

Google actualitza el valor del PageRank que mostren les seves barres

Actualització del PageRank de Google a maig 2007.

Tal com estava previst, aquest cap de setmana Google ha actualitzat el PageRank que es mostra en les barres de Google que els usuaris tenen instal·lades als seus navegadors. Google només actualitza aquestes dades cada quatre mesos.

Què és el PageRank i quina importància té en l'algoritme d'ordenació de resultats?

El PageRank és l'algorisme que Google utilitza per donar un valor numèric a la importància que té una pàgina web. Aquest valor l'utilitza com a part de l'algorisme que marca l'ordre en què es mostren els resultats d'una cerca a Google.

El PageRank es diu així en honor al seu creador Larry Page. PageRank no significa "rànquing de pàgines".

La finalitat de PageRank és assignar un valor numèric a les pàgines web segons el nombre de vegades que altres pàgines les recomanen i segons el PageRank que tinguin aquestes pàgines. És a dir, estableix la importància d'aquesta pàgina web.

Des del 24 de gener (dia en què Google va canviar el seu algoritme d'ordenació per neutralitzar algunes de les trampes que realitzaven administradors web desaprensius), en el PageRank també influeix la fiabilitat de la pàgina web ... (però això no ho explicarem ara, sinó que serà motiu d'un altre article).

Com funcionen les actualitzacions ?: diferència entre el PageRank real i el PageRank de la barra de Google

El PageRank que ens mostra la barra de Google només s'actualitza un cop cada 4 mesos, aproximadament.

La barra ens mostra un PageRank en base 10 en una escala logarítmica. És a dir, és fàcil pujar de 0 a 1 o de 2 a 3, però en canvi és molt difícil pujar de 5 a 6, i encara més pujar de 6 a 7. Però aquest no és el PageRank real de la nostra pàgina, sinó el valor que Google li va assignar l'última vegada que va actualitzar el PageRank de la barra.

L'última actualització es va dur a terme el 24 de gener i aquesta vegada ho ha fet l'1 de maig, uns dies abans que es complissin els 4 mesos preceptius.

Durant 2006 hi va haver 4 actualitzacions de PageRank: al febrer, a l'abril, al juliol i al final de setembre. És a dir, en 4 ocasions durant 2006 Google ha calculat el valor del PageRank en base 10 i l'ha exportat als servidors que alimenten les barres de Google. Durant el 2007 està seguint el mateix patró.

El PageRank que utilitza Google per als seus càlculs és molt més precís i utilitza una escala molt més gran, encara que no sabem quant, ia Google hi ha un hermetisme complet sobre això, encara que sembla que és en base 100. Els seus servidors interns el s'actualitzen diàriament.

Quan serà la propera actualització?

Si tot segueix el seu curs, hauríem esperar-la cap a principis del mes de setembre. Així que totes les accions per pujar el PageRank que portem a terme a partir d'ara, no es veuran reflectides a la barra de Google fins al setembre.

Això no vol dir que abans de setembre, les nostres accions no serveixin per a res. Res més lluny de la realitat. Recordem que Google treballa amb un PageRank a temps real.

Com conèixer el PageRank en temps real?

El PageRank exacte i amb valor numèric, no ho podem saber en temps real, però sí que podem conèixer una aproximació al PageRank real, encara que és en base 4 en lloc de en base 10 i amb valors relatius.

Per conèixer el nostre PageRank real en base 4, en tenim prou amb registrar-nos a Google com a administradors web (Google 'Tot sobre Google' Informació per a administradors web 'Eines per a administradors web), aquí podrem donar d'alta el nostre site, Google ens demanarà una verificació del site ( per assegurar-se que realment som el webmaster del site) i des d'aquí, podrem veure el PageRank de les nostres pàgines en temps real i en base 4. Google ens indica si les pàgines tenen PageRank alt, mitjà, baix o zero.

No és molt el que vam aconseguir amb això, però almenys sabrem si tenim PageRank assignat a cada pàgina, i podrem anar veient si va augmentant el nombre de pàgines del nostre web que passen de mig a alt, o de baix a mitjà.

En la meva barra de Google no veig el PageRank, què he de fer?

Per defecte, la barra de Google no inclou aquesta informació, però des de les opcions de la barra podràs incloure PageRank, i d'aquesta manera, mentre navegues per la xarxa podràs conèixer els PageRank de les pàgines que visites. Això t'ajudarà a saber en quines pàgines web hauries intentar incloure els teus enllaços perquè augmenti el teu PageRank.

Enllaços d'interès:

Com puc millorar el PageRank de la meva pàgina web ?:
http://www.geamarketing.com/posicionamiento/mas_pagerank.php

Curs Online gratuït de Posicionament en Cercadors:
http://www.geamarketing.com/posicionamiento_buscadores.php

Com s'indexa el https?

La indexació del https és un d'aquells misteris que fa la vida dels SEO més interessant. Si bé sabem que és possible indexar en la major part dels cercadors, gairebé ningú sap com aconseguir-ho en el mínim temps possible.

Què és el https?

El https és la versió segura del protocol http. La diferència entre un i l'altre és que el primer transmet les dades xifrades, i el segon els transmet sense xifrar.

El sistema https utilitza un xifrat basat en les Secure Socket Layers (SSL) per enviar la informació.

La descodificació de la informació depèn del servidor remot i del navegador utilitzat per l'usuari.

És utilitzat principalment per entitats bancàries, botigues en línia, i qualsevol tipus de servei que requereixi l'enviament de dades personals o contrasenyes.

Com funciona el https?

Contràriament al que pensa molta gent, el https no impedeix l'accés a la informació, només la encripta quan la transmet. Per aquest motiu el contingut d'una pàgina web que utilitza el protocol https pugui ser llegit per les aranyes dels cercadors. El que no pot ser llegit és el contingut que s'envia des d'aquesta pàgina web al seu servidor, per exemple, el nom d'usuari i la contrasenya d'accés a una zona privada de la pàgina web.

El port estàndard per aquest protocol és el 443.

Com sabem que realment s'indexa el https?

Google indexa https des d'inicis del 2002 i progressivament, la resta de cercadors han anat adaptant la seva tecnologia per indexar també el https.

L'últim cercador en fer-ho ha estat MSN, que ho va aconseguir el juny de 2006.

Si busquem "https: // www." O bé inurl: https en els principals cercadors, trobarem pàgines https indexades en ells.

Com podem indexar el nostre https?

En principi, de forma natural podem indexar les nostres pàgines a https, però com aquest protocol transmet la informació de forma molt més lenta, algunes vegades les aranyes no aconsegueixen descarregar les pàgines en el temps que tenen establert i se'n van sense indexar. Aquest és el principal problema amb què ens podem trobar. El resoldrem intentant disminuir el temps de descàrrega d'aquestes pàgines.

Com podem accelerar la indexació del https

Hi ha dues tècniques:

  1. Google Sitemap: Incloure en el nostre mapa del web les pàgines https (ens referim al google mapa del web, no a l'sitemap per humans), i donar-lo d'alta en Sitemaps de google.
  2. Guerrilla: repartir per tot Internet enllaços que vagin a les nostres pàgines https, i aconseguir d'aquesta manera que les aranyes que estan indexant les pàgines on tinguem els enllaços, entrin també en la part https del nostre web.

Com podem fer que no es indexi el nostre https

No és tan fàcil com sembla. No ens serveix incloure les pàgines https en el nostre robots.txt. Cada port necessita el seu propi robots.txt, així que haurem de crear un robot.txt per a les nostres pàgines http i un altre per a les nostres pàgines https. O sigui, haurem de tenir també una pàgina anomenada

https://www.nombredelapagina.com/robots.txt

Si necessites ajuda per indexar o desindexar teves pàgines https, no dubtis en contactar-nos. Estarem encatados de assistir.

Informació complementària:

Bloc de MSN sobre indexació - Article on expliquen que MSN comença a indexar https
http://blogs.msdn.com/livesearch/archive/2006/06/28/649980.aspx

Informació de Google sobre com indexar https:
http://www.google.es/support/webmasters/bin/answer.py?answer=35302

Més informació sobre Sitemaps de google:
Sitemaps de Google
http://www.geamarketing.com/articulos/Descubre_indexacion_futuro_Google_SiteMap.php

Curs online, gratuït, de posicionament en cercadors: Curs de posicionament en cercadors
http://www.geamarketing.com/posicionamiento_buscadores.php

Actualització del PageRank de Google a setembre 2006

El 28 de setembre passat Google va actualitzar el PageRank que mostra la seva barra de navegació. Moltes pàgines web han vist com el seu pujava, o com baixava ...

Ya hemos comentado otras veces que el PageRank que nos muestra la barra forma parte de una escala logarítmica de 10. Es decir, es fácil subir de 0 a 1 o de 2 a 3, pero en cambio es muy difícil subir de 5 a 6, y aún más subir de 6 a 7. En cambio el PageRank que utiliza Google para sus cálculos es mucho más preciso y utiliza una escala mucho mayor, aunque no sabemos cuánto. En Google existe un hermetismo total a este respecto.

O sea, el PageRank de la barra de Google no muestra el PageRank calculado en tiempo real (que es el utilizado por Google en el cálculo de su algoritmo de ordenación) sino que muestra la última actualización. Durante 2006 hubo 4 actualizaciones de PR: en febrero, en abril, en julio y ésta última, a finales de septiembre. Es decir, en 4 ocasiones durante 2006 Google ha cogido su PageRank, lo ha distribuido en base 10 y lo ha exportado a los servidores que alimentan las barras de Google.

Esto quiere decir que en principio, aunque alguien vea un cambio de PageRank en su barra de Google, sus resultados en Google no deberían verse afectados, ya que Google ya ha estado utilizando su PageRank actualizado durante algún tiempo. Así que aunque haya aumentado o haya disminuido, los resultados de octubre, en cuanto a lo que al PageRank se refiere, serán los mismos que ésta página tuvo en septiembre.

Ens consta, que les pàgines que s'han posat en línia en els últims 3 mesos no tenen nou PageRank. La nostra pàgina web és un exemple d'això: està en línia des del 29 d'agost i encara no ens ha assignat PageRank a la barra de navegació. El nostre mateix cas pot trobar-se en molts dels fòrums que tracten temes de PageRank. Esperem que en la propera actualització se'ns assigni.
La propera exportació està prevista per a principis de gener. Veurem què ens depara ...

Enllaços d'interès:

Informació sobre què és el PageRank i per a què serveix:
Què és el PageRank

Curs online de Posicionament en Cercadors, gratuït:
Curs de Posicionament en Cercadors

Bloc de Matt Cutts amb algunes preguntes i respostes sobre aquesta última actualització:
Actualització Google PageRank

Gloogle Trends - L'analitzador de tendències que pot ajudar-te a millorar les teves campanyes d'adwords

Des de fa alguns mesos, des de Google Labs, Google ens ofereix una nova eina per conèixer les tendències de recerca d'un terme, o per poder comparar tendències de recerca de dos o més termes.

www.google.com/trends

Tal com adverteix Google, aquesta eina està en fase beta, pel que els seus resultats no són encara 100% fiables, però tot i així, la informació que ens proporciona és útil i podem treure un bon partit d'ella.

Com podem utilitzar Google Trends a nivell de Màrqueting Digital?

És obvi que a part del plaer de satisfer la nostra curiositat, Google Trends té més utilitats. La més destacada és com a complement a l'eina de selecció de paraules clau de Google Adwords.

Comparativa entre dos o més termes per contractar Adwords

Tot i que Google Adwords ja ens ofereix una eina semblant:
https://adwords.google.es/select/KeywordToolExternal

Si busquem paraules clau relacionades amb "turisme a Barcelona" a l'eina de Google Adwords i seleccionem l'opció "Tendències de volum de cerques globals", obtenim les dades que es mostren en aquesta imatge:

Aquesta informació ens és útil per seleccionar les paraules clau per les que desitgem que es mostri el nostre anunci, però si realitzem aquesta mateixa cerca a Google Trends comparant "turisme a barcelona" amb "hotels a barcelona", el resultat que ens ofereix és més complet i ens permet millorar molt més la campanya.

La herramienta de Google Adwords nos indica las palabras clave relacionadas con la palabra inicial, pero Google Trends nos muestra la evolución de las búsquedas de esos términos, y la información sobre el origen de ésas búsquedas. Nos las puede mostrar incluso por ciudades. Y si seleccionamos una región en concreto, nos lo indica por ciudades de esa región. Esto nos puede ayudar mucho a crear nuestra campaña y a segmentarla correctamente.

Para términos en otros idiomas, aún es más importante la información sobre las búsquedas regionales. Por ejemplo, si la búsqueda la escribimos en Inglés: “Tourism in Barcelona”, y seleccionamos la tendencia por regiones, veremos las búsquedas de éste término por países.

Aunque los resultados de esta búsqueda creo que sí se ven afectados por el hecho de que se trata de una beta… por mi experiencia en marketing turístico no me parece lógico que la mayor parte de búsquedas realizadas en Google para el término en cuestión, estén hechas desde Irlanda… así que creo Google no tiene en cuenta todas las búsquedas de todos los Google’s locales de todo el mundo. Pero bueno… aún así, la información que nos ofrece es útil y ayuda a completar la información que obtenemos desde Google Adwords… y si ahora ya nos es útil, es de esperar que en un futuro próximo esta herramienta deje de ser beta y aún pueda sernos de más utilidad.

El web de BMW expulsada de Google ... ¿podria passar-te a tu?

És la notícia de la setmana: El web de BMW alemanya ha estat expulsada de Google.de per practicar spam a cercadors.

Ha estat el bloc de Matt Cutts qui ha revelat aquesta expulsió. Matt és un empleat de Google que escriu un dels millors blocs amb contingut SEO de la xarxa. Òbviament, Matt no revela res que Google no vulgui, però almenys la informació que ofereix és sempre de primera mà i ve directament de la seva font.

Vegem què és el que ha passat ...

Ja fa unes setmanes Matt comentava que Google va a posar-se molt més dur contra el correu brossa a cercadors i que entre febrer i març canviarà la seva forma d'indexar els sites, per combatre'l. No canviarà l'algorisme, però els seus aranyes buscaran el spam i el reportaran per a la seva posterior eliminació.

El problema de l'spam s'està convertint en un malson per als principals cercadors i el cas de BMW no és un cas aïllat. Molts administradors web creuen poder enganyar Google ia la resta de cercadors utilitzant codi ocult o camuflant paraules entre els seus textos.

Moltes vegades, navegant pels resultats de Google et trobes amb pàgines que no estan correctament posicionades ... però no per ser bones ... si no a l'inrevés. Et preguntes com pot ser que una pàgina tan "cutre" i amb un contingut tan pobre, pugui estar a la primera posició per una recerca amb més de cinc-cents mil resultats. Si mires bé el codi, acabes trobant la raó. El cas de BMW és també amb codi ocult, ara ja no podem veure-ho si no és en la imatge que ens mostra Cutt, però encara hi ha moltes pàgines que practiquen spam i que Google no ha detectat i expulsat.

Vegem un exemple on encara es pot veure el codi ocult:

www.todoalarmas.com

Si busquem a Google "alarmes llar", trobarem 996.000 resultats. Aquesta pàgina està en primer lloc. Si entres en ella veuràs que no hi ha motius aparents perquè ocupi aquest lloc. Però si edites el seu codi font, descobriràs per què està en primera posició: un text ocult en un "no script" amb més de 3000 paraules.

Nota: no podràs veure el seu codi si prems sobre el botó dret del ratolí i li dones a veure codi ... (d'això ja s'han encarregat ells de que no puguis fer-ho), però sí veuràs seu codi si vas a la barra del menú superior i prems sobre: veure >> Codi font.

Veurem quant duren ...

Mirant si desapareixen o no de Google, també podrem saber quan Google ha activat el sistema antispam d'indexació.

... I sobre BMW: els de BMW ja han demanat disculpes a Google i Google ja els ha tornat a posar en la llista de sites a indexar, de manera que en la propera actualització seves pàgines aniran tornant a ser indexades. Però es triga el seu temps (veure mesos) en indexar de nou una web sencera, amb totes les seves pàgines. (A no ser que utilitzis el "site map" de Google per fer-ho, cosa que no sé si BMW farà ... ja ho veurem).

La moralitat de tot això és: No intentis enganyar Google i centra't en construir bé les pàgines i en tenir un contingut interessant que aconsegueixi que altres webs et recomanin (això et farà pujar el PageRank). Feu un pla i s'adhereixen a Màrqueting Digital.

La moralitat 2 seria: Realment els cercadors influeixen de forma definitiva en l'èxit o el fracàs de les pàgines web ... en cas contrari, BMW no s'arriscaria a ser expulsada per un tema així, ni moltes altres pàgines web.

Informació complementària:

Article on explicàvem què és el correu brossa en cercadors i la possible solució de Google contra ell en incloure l'algoritme de Trust Rank per matisar el Page Rank:
Descobreix com serà el substitut Google PageRank: el TRUST RANK

Article on explicàvem què és el servei de "site map" de Google i on expliquem com funciona: Descobreix la indexació del futur: Google SiteMap

Text camuflat per BMW:
http://www.mattcutts.com/blog/ramping-up-on-international-webspam/

Curs gratuït de posicionament en cercadors, que no et portarà a l'expulsió: Curs Online de Posicionament en Cercadors

Descobreix com serà el substitut Google PageRank: el TRUST RANK

Des de fa alguns mesos es ve especulant sobre la possibilitat que Google canviï l'algoritme de PageRank per un nou algorisme que filtraria tot el correu brossa a cercadors o almenys intentaria neutralitzar-lo. Descobreix en aquest article tot el que se sap fins al moment, sobre el nou algoritme el nom és Trust Rank.

L'spam a cercadors s'ha convertit en un veritable problema per a Google i la resta de motors de cerca. Webmasters sense escrúpols han creat milers de pàgines amb l'únic propòsit d'enllaçar amb les seves pàgines principals i amb això fer pujar el seu PageRank (en el cas de Google) o qualsevol altre algoritme utilitzat per cercadors que tenen en compte el nombre d'enllaços que recomanen una pàgina, a l'hora de determinar la importància d'aquesta i situar-la en millor posició en els resultats de cerca.

Aquesta és la tècnica utilitzada per aconseguir que quan busques "Lladres" a Google, et aparegui en primera posició la web de la SGAE.

El nou algoritme de Google evitaria aquest tipus de pràctiques.

La finalitat del PageRank és assignar un valor numèric a les pàgines web segons el nombre de vegades que altres pàgines les recomanen i segons el PageRank que aquestes tinguin al seu torn. És a dir, estableix la importància d'aquesta pàgina web. La seva lògica és la següent: si una pàgina web enllaça amb una altra pàgina, és que l'està recomanant. I si la recomana, és que ha de ser important en l'àmbit del tema que tracta la primera pàgina web. Una recomanació que prové d'una pàgina que al seu torn està molt recomanada val més que una recomanació que provingui d'una pàgina que gairebé ningú recomana.

Google desea que en las primeras posiciones de los resultados de búsqueda encontremos páginas de cierta relevancia y que estén siendo recomendadas por otras páginas que a su vez también tengan relevancia. Para determinar el PageRank, Google analiza el número de enlaces que provienen de otras páginas web y su PageRank. El Trust Rank, parte de la misma base. Pero en lugar de valorar la importancia de una recomendación en función del PageRank de la página que recomienda, lo hace a partir de una serie de páginas web que han sido consideradas importantes por humanos en lugar de por algoritmos.

A les pàgines web que els humans han determinat com importants se les considera "web llavor" i als seus enllaços se'ls assigna un valor. I serà aquest valor el que s'anirà transmetent per tota la xarxa.

Per il·lustrar-ho amb un exemple: Suposem que disposem d'una web llavor "A". "A" transmetrà un valor de 100 Trust Rank a totes les webs a les que enllaci. Aquestes pàgines, al seu torn, transmetran un Trust Rank de 99 a totes les webs a les que enllacin. I aquestes últimes, transmetran un Trust Rank de 98 a què elles enllacin.

Per mitigar la degradació del Trust Rank a mesura que es distancia de les webs llavor, en l'algoritme s'ha inclòs un corrector que té en compte el nombre de graus que hi ha entre el web llavor i la web que rep el Trust Rank, sense anul·lar completament la distància que les separa de la llavor.

Segons un document de la Universitat de Standford que versa sobre el Trust Rank, de la mateixa manera que les webs llavor van a transmetre Trust Rank, les webs considerades spam pels humans que avaluen les webs, van a transmetre Trust Rank negatiu. Segons aquest document certes webs van a restar Trust Rank i quan una pàgina web situï el seu nivell de Trust Rank per sota d'una determinada xifra, es convertirà automàticament en un web que transmet Trust Rank negatiu en lloc de positiu. (S'inclou un enllaç a aquest document al final de l'article).

La idea del Trust Rank sembla bona, però hi ha certes qüestions que s'han de tenir en compte:

Qui seran els webs llavor?

Referent a això hi ha discrepàncies ... El document de Stanford parla d'un algoritme que determinarà les webs que poden ser llavor. En certs fòrums especialitzats en posicionament en cercadors s'afirma que seran les webs governamentals i d'universitats les que començaran a transmetre el Trust Rank llavor, i en altres fòrums s'afirma que Google fa mesos que està contractant gent de tots els països perquè avaluïn de manualment les webs més representatives del seu país. Aquesta última possibilitat sembla la més plausible, ja que hi ha indicis que efectivament, Google ha contractat avaluadors de webs.

¿Es realitzarà spam al revés?

Així al bot i pensant en aquest futur no molt llunyà en què el Trust Rank funcionarà, se m'acut que potser els mateixos que juguen a que buscant la paraula "lladres" surti la SGAE, potser puguin jugar a sabotejar pàgines web, enllaçant despietadament des de les pàgines d'spam i per tant restant-Trust Rank, perquè no apareguin en els primers llocs dels cercadors.

¿Quan tindrem el Trust Rank incorporat en l'algoritme de Google?

Ni idea ... aquí ningú es posa d'acord. El dia menys pensat Google llança un comunicat i ens informa que ja ho ha implementat. El que sí està clar és que ho ha de comunicar a la premsa i als internautes. Sens dubte suposarà una gran millora qualitativa en l'obtenció dels resultats de cerca així que Google farà que la gent s'assabenti d'això, dubto que el departament de comunicació de Google deixés passar una oportunitat com aquesta.

Informació complementària per a qui vulgui ampliar coneixements:

Enllaç al document de la Universitat de Stanford que versa sobre el Trust Rank: http://dbpubs.stanford.edu:8090/pub/2004-17

Curs de Posicionament en Cercadors (que sens dubte caldrà modificar el dia que s'implementi el Trust Rank, però que ja inclou el nou sistema d'indexació amb el Google Site Map Generator): Curs Online de Posicionament en Cercadors. El curs és gratuït.

Descobreix la indexació del futur: Google SiteMap

Google ens proposa el que serà la nova forma d'indexar pàgines web.
Els motors de cerca com Google i Yahoo, utilitzen aranyes per recollir la informació de les pàgines web que hi ha publicades a Internet. Un cop tenen la informació, la processen per poder ordenar ràpidament els resultats de recerca, en funció d'un algoritme determinat, quan un usuari acudeix a les seves respectives pàgines web i inquireix algun terme o alguna frase.

Les aranyes dels cercadors visiten periòdicament les pàgines web que estan publicades a Internet i actualitzen automàticament la informació sobre el seu contingut.

Fins ara, les aranyes entraven en el directori arrel d'un domini, buscaven el fitxer robots.txt per assegurar-se que el site desitjava ser indexat i després procedien a visitar tots els enllaços que trobaven a la pàgina web, registrant així tot el contingut de la pàgina.

Google Sitemaps revolucionarà aquesta forma d'indexar les pàgines web.

No es sólo que Google ahora lea con más detenimiento los mapas del site que la gente incluye en sus páginas web… no es nada de esto… es una nueva forma radical de indexar el contenido de las páginas. Google nos propone la creación de un sitemap en XML siguiendo unas especificaciones determinadas que darán toda la información a sus arañas y que les permitirá el acceso a urls que hasta ahora podían haber estado escondidas por diversos motivos ajenos a la voluntad de los webmasters.

Google desitja poder accedir a tot el contingut de les pàgines web de la forma més fàcil i eficient. Tal com ara està plantejada la indexació de pàgines, tot i ser molt més eficient que els índexs humans que teníem antany (qui no recorda haver anat a un cercador, haver inserit a mà la definició del nostre site, les paraules clau per les que desitjàvem ser trobats i la URL del lloc ... però això és ja prehistòria internàutica), el que Google ens planteja ara és molt millor.

Tot consisteix a posar a la disposició de les aranyes un mapa del web especial.

Per crear aquest mapa del web, només cal disposar una aplicació que s'instal·la en el nostre servidor (hi ha versions per a tots els sistemes operatius) i que crea un mapa del web en un format determinat. L'aplicació que ens proposa Google pot generar el mapa a partir de les URL de la pàgina web, a partir dels directoris de la pàgina web, o a partir dels logs del servidor (ideal per a pàgines dinàmiques).
Un cop tenim el mapa del fet segons les especificacions de Google, podem donar-lo d'alta a Google Sitemaps. Automàticament i en menys de 4 hores, Google ho haurà indexat.

Google permet que els administradors web creïn un cron que generi un nou mapa fins a cada hora (per sites amb molta renovació de contingut) i que faci el submit del mapa automàticament a Google Sitemaps. D'aquesta manera, les aranyes coneixeran immediatament les noves pàgines creades i les podran incorporar a l'índex.

Avantatges d'aquesta aplicació:

No importa el mal que tinguis la pàgina web a nivell de camins per a les aranyes ... amb un site map creat pel Sitemap Generator, les aranyes de Google sempre trobaran les url de totes les pàgines.

Un altre gran avantatge és la ràpida indexació del contingut de tot el site. En menys de 4 hores, les aranyes han visitat fins a 50.000 enllaços de la nostra pàgina web. Per webs amb més URL, Google recomana realitzar diversos sitemap i disposar d'un índex de Sitemaps.

Desavantatges d'aquesta aplicació:

Requereix una mica de coneixements en programació, de manera que, o bé els ISP ofereixen aquest servei com a valor afegit per als seus clients o bé moltes pàgines web no disposaran d'aquest servei i hauran de seguir sent indexades per aranyes normals i corrents.

Els sitemap que ja estan disponibles a la major part de pàgines web no són compatibles amb el format de Google. Google vol un document en XML amb unes especificacions determinades.

Amb aquest projecte, Google busca sens dubte, la forma de millorar la indexació de les pàgines web i poder comptar en els seus índexs amb pàgines que fins ara es perdien en un mar d'enllaços dins dels nostres sites.

Google ha creat el Sitemap Generator i el servei d'indexació Express i l'ofereix de forma completament gratuïta ... serà interessant veure la reacció de Yahoo davant això, ja que Yahoo ofereix el servei d'indexació ràpida previ pagament de 49 $, 20 $ o 10 $ segons el nombre de url que desitgem indexar de forma accelerada.

De momento no disponemos de resultados de primera mano respecto a la efectividad de la indexación a través del SiteMap de Google. En cuanto tengamos instalado el nuevo sitemap en varias páginas web y estemos en disposición de hacer comparativas de número de incremento en páginas indexadas y de frecuencia de visititas de arañas, escribiremos un nuevo artículo informando de los resultados. Nos vemos entonces.

Nota posteriorHan passat alguns mesos des que escrivim aquest article. Els resultats han estat molt bons. Tota una web resta indexada de nou en menys de 24 hores. És ideal per quan un nou web surt a la xarxa. La pots tenir indexada en un moment, sense haver d'esperar mesos i mesos a que les aranyes de Google llegeixin tot el seu contingut.

Informació complementària:

URL amb informació sobre el mapa del Google:
https://www.google.com/webmasters/sitemaps/docs/en/about.html

URL amb especificacions sobre el mapa del Google:
https://www.google.com/webmasters/sitemaps/docs/en/protocol.html