Diseño web y Posicionamiento en buscadores

Blog dedicado al diseño de páginas web y al posicionamiento en buscadores SEO.

22/04/2009

Los usuarios pueden influir en el ranking de una página

Desde hace mucho tiempo ya existían especulaciones de que los algortimos del buscador de Google podrían usar informaciones de AdSense y Google Analytics para calcular el ranking de una página en el índice del buscador.


1st Search Engine Rankings Seo Blog ha realizado varios experimentos con 100 usuarios anónimos y ha llegado a resultados muy interesantes.


1. Experimento: Cual es el efecto de los clics en el Ranking?

Una página que estaba fija en la posición 10 del ranking para una palabra clave y que no tenia AdSense o Google Analytics fue tomada como base para este experimento.


Durante una semana, los 100 usuarios buscaron en Google esa palabra clave y solo hicieron clic en la página mencionada en la posición 10. Poco después, esta página apareció en la posición 2.


Parece que Google registra la relevancia que dan los usuarios a los resultados y registran las páginas más pinchadas, así como también la relevancia que dan usuarios que vuelven nuevamente a esa página mediante la misma búsqueda.


2. Experimento: Influencia del tiempo de permanencia en una página

Una página con Google Analytics que se encontraba en la posición 78 para una palabra clave fue usada para este experimento.


Los 100 usuarios entraron a esta página y estuvieron 1 hora leyendo, haciendo clics, etc. El tiempo de permanencia de los usuarios en la página aumento considerablemente.


Después de una semana, la página subió de la posición 80 a la 33.


Esto demuestra, que los datos de Google Analytics serían usados para calcular el ranking del buscador.


Conclusiones

Aunque estos experimentos no son representativos, muestran que Google ahora ya no solamente esta usando los parámetros clásicos como el PageRank, el numero de enlaces, enlaces relevantes, etc, sino también a los mismos usuarios del motor de búsqueda y varios de sus servicios como AdSense y Google Analytics para calcular el ranking de las webs.


Y todo esto explica mucho mejor, porqué desde hace algún tiempo el posicionamiento de webs se ha complicado de sobremanera.


Con este tipo de métricas, páginas sin contenido interesante para los usuarios van a ir bajando cada vez más en sus posiciones. Esto vale sobre todo para aquellas páginas que solo sirven para redireccionar el tráfico a anuncios de afiliados como AdSense y otros, ya que los usuarios solo permanecen algunos segundos en estas páginas.

Fuente: http://www.webtaller.com

Etiquetas: , ,

21/03/2009

El fichero Robots.txt

Explicamos el porqué del archivo robots.txt y como se construye dicho archivo.

Para comenzar tenemos que comentar lo que son los robots y qué función cumplen dentro de la red de redes. Un robot es un programa más o menos complicado que se dedica a rastrear nuestras páginas webs y guardar su contenido en una base de datos y seguir los enlaces que tengamos a otras páginas web. Esto nos beneficia pero también nos puede perjudicar, ya que a veces no nos conviene indexar ciertas páginas de nuestras webs.

Actualmente los robots actúan de tal forma que lo primero que hacen es buscar en la raíz de nuestra página si tenemos un archivo llamado robots.txt, si lo encuentra lo lee y sigue las directrices que en él se encuentran, si no lo encuentra empieza a rastrear toda la web.

Por este tema es importante crear bien este archivo y pensar que páginas queremos que sean rastreadas y cuáles no, ya que las que no sean rastreadas no serán indexadas en los navegadores.

Este archivo es muy fácil de construir tan solo tienes que saber ciertas pautas y podrás hacerlo sin problema. El archivo robots.txt puede construirse para que se aplique solo a los robots de determinados buscadores.

Pasamos a escribir un ejemplo para ir explicando las posibilidades:

User-agent: * # aplicable a todos los robots
Disallow: / # impide la indexacion de todas las paginas.

En este ejemplo los robots no podrían indexar ninguna pagina del dominio. User-agent lo que nos dice es a que robots se les aplica las características que le siguen debajo. Si usamos el * estamos diciendo que esas reglas son aplicables para todos los robots. Pero también podemos hacerlo para determinados robots, como ves en el siguiente ejemplo:

User-agent: lycra
User-agent: BadBot
Disallow: /

En este ejemplo los robots lucra y BadBot tendría prohibida la indexación de cualquier pagina del dominio.

El disallow nos dice los archivos o carpetas que queremos que no sean indexadas. De esta forma podríamos hacer un archivo como este:

User-agent: *
Disallow: /tmp/prueba.html
Disallow: /logs

Este ejemplo lo que haría sería prohibir la indexación de la carpeta logs y el archive prueba.html a todos los robots.

Con esto ya podríamos realizar un archivo robots.txt perfectamente válido, pero también existen términos para determinar en qué horas queremos que esos robots rastreen nuestras páginas. La forma de construirlo es la siguiente:

Visit-time: 0300-0400 #esta opción obligaría a rastrear las paginas solo de 3 am a 4 am

Recuerda que las horas siempre se colocan en Greenwitch

Por otro lado podemos decirle que indexe una página o varias cada equis tiempo, para ello se utiliza la siguiente sintaxis:

Request-rate: 1/30

Siendo el 1 el número de documentos a rastrear y el 30 el tiempo que transcurre entre un rastreo y el siguiente.

Es importante saber que no puedes dejar líneas en blanco ya que no funcionaria, el robots dejaría de leer en el momento que encuentra la línea en blanco.

Otro aspecto que no he comentado antes pero que habréis notado es que los comentarios ser realizan utilizando la #.

Un ejemplo completo seria el siguiente:

User-agent: *
Disallow: /tmp/prueba.html
Disallow: /logs
Visit-time: 0300-0400

Esto permitirá a todos los robots rastrear todas las paginas menos prueba.html y la carpeta logs, además solo podrían indexar de 3 de la mañana a 4.

fuente: www.webtaller.com

Etiquetas: ,