La indexació de lhttps és un daquests misteris que fa la vida dels SEO més interessant. Si bé sabem que és possible indexar-ho a la major part dels cercadors, gairebé ningú sap com aconseguir-ho en el mínim temps possible.
Què és el https?
https és la versió segura del protocol http. La diferència entre l'un i l'altre és que el primer transmet les dades xifrades, i el segon les transmet sense xifrar.
El sistema https utilitza un xifratge basat en Secure Socket Layers (ssl) per enviar la informació.
La descodificació de la informació depèn del servidor remot i del navegador utilitzat per lusuari.
És utilitzat principalment per entitats bancàries, botigues en línia, i qualsevol tipus de servei que requereixi l'enviament de dades personals o contrasenyes.
Com funciona el https?
Contràriament al que pensa molta gent, https no impedeix l'accés a la informació, només l'encripta quan la transmet. Per això el contingut d'una pàgina web que utilitza el protocol https pot ser llegit per les aranyes dels cercadors. El que no es pot llegir és el contingut que s'envia des d'aquesta pàgina web al vostre servidor, per exemple, el login i la contrasenya d'accés a una zona privada de la pàgina web.
El port estàndard per a aquest protocol és el 443.
Com sabem que realment s'indexa https?
Google indexa https des del començament del 2002 i progressivament, la resta de cercadors han anat adaptant la seva tecnologia per indexar també l'https.
L'últim cercador a fer-ho ha estat MSN, que ho va aconseguir el juny 2006.
Si busquem «https://www.» o bé inurl:https als principals cercadors, trobarem pàgines https indexades en ells.
Com podem indexar el nostre https?
En principi, de forma natural podem indexar les nostres pàgines a https, però com que aquest protocol transmet la informació de forma molt més lenta, algunes vegades les aranyes no aconsegueixen descarregar les pàgines en el temps que tenen establert i se'n van sense indexar-lo. Aquest és el principal problema amb què ens podem trobar. Ho resoldrem intentant disminuir el temps de baixada d'aquestes pàgines.
Com podem accelerar la indexació de l'https
Hi ha dues tècniques:
- Google Sitemap: Incloure al nostre sitemap les pàgines https (ens referim al google sitemap, no al sitemap per a humans), i donar-lo d'alta en sitemaps de google.
- Guerrilla: repartir per tot Internet enllaços que vagin a les nostres pàgines https, i aconseguir així que les aranyes que estan indexant les pàgines on tinguem els enllaços, entrin també a la part https de la nostra web.
Com podem fer que no s'indexi el nostre https
No és tan fàcil com sembla. No ens serveix incloure les pàgines https al nostre robots.txt. Cada port necessita el seu propi robots.txt, així que haurem de crear un robot.txt per a les nostres pàgines http i un altre per a les nostres pàgines https. O sigui, haurem de tenir també una pàgina anomenada
Si necessites ajuda per indexar o desindexar les teves pàgines https, no dubtis a contactar-nos. Estarem encastats d'assistir-hi.
Informació complementària:
Blog de MSN sobre indexació – Article on expliquen que MSN comença a indexar https
http://blogs.msdn.com/livesearch/archive/2006/06/28/649980.aspx
Informació de Google sobre com no indexar https:
http://www.google.es/support/webmasters/bin/answer.py?answer=35302
Més informació sobre sitemaps de google:
SiteMaps de Google
http://www.geamarketing.com/articulos/Descubre_indexacion_futuro_Google_SiteMap.php
Curs en línia, gratuït, de posicionament en cercadors: Curs de posicionament a cercadors
http://www.geamarketing.com/posicionamiento_buscadores.php



