PageRank

10 abril 2009 at 17:14 Deja un comentario

En mi proyecto final de carrera, orientado a SEO, existe un apartado dedicado al PageRank. Seguro que algunos lo habréis visto, pero ¿sabéis qué es realmente? Pues de eso hablaré hoy.

Antes de nada, empecemos hablando del concepto de popularidad en Internet. En los motores de búsqueda, cuantos más clics se hagan sobre un enlace, más posibilidades tendrá el sitio web al que se dirija éste de subir en la lista de resultados. Es bueno empezar a cimentar la base de la popularidad del sitio con anuncios, info-tutoriales y anuncios por e-mail (ejemplo: lista de correo). Estos esfuerzos se redoblarán una vez se lance el sitio web.

La optimización del sitio web ayuda a ganar popularidad, la cual influirá en los resultados de los motores de búsqueda. Esto necesita tiempo y un esfuerzo constante para atraer visitantes. Esto, además, se apoya en los enlaces que llegan de otros sitios web. Basándose en esto, tenemos el PageRank de Google.

PageRank se encarga de averiguar el “peso” de un sitio web en el motor de búsqueda sopesando esos enlaces externos, que actúan como “votos”.

PageRank (PR) consiste en un grupo de algoritmos que dan un valor numérico a las páginas en la Red según su relevancia, que se mide según los enlaces ‘votantes’, donde además se observan los sitios ‘votantes’, midiendo su importancia y relevancia con el sitio web objetivo. Un sitio enlazado por sitios con un PR alto y relevantes tendrá un PR alto.

Fue desarrollado por Larry Page y Sergey Brin en la Universidad de Stanford, tomando como modelo el Science Citation Index (SCI) elaborado por Eugene Garfield para el Instituto de información científica (ISI) en los Estados Unidos durante la década del 50, que basa la asignación objetiva de méritos científicos suponiendo que los investigadores cuyo factor de impacto (número de publicaciones y/o referencias bibliográficas en otros trabajos científicos) es más alto, colaboran en mayor medida con el desarrollo de su área de investigación.

La versión exacta del algoritmo no está disponible al público, existiendo sólo ejemplos de su uso disponibles en sitios como la Wikipedia. De hecho, la versión mostrada en la Wikipedia es un modelo inicial del verdadero algoritmo de PR y se define por la siguiente fórmula:

En la fórmula, PR(A) es el PageRank de la página objetivo y PR(Ti) el de las páginas ‘votantes’. C(Ti) el número de enlaces que salen de las páginas ‘votantes’. Por último, d es un factor de amortiguación entre 0 y 1, siendo un valor bastante aceptado el de 0,85. Representa la probabilidad de que un navegante continúe pulsando enlaces al navegar por Internet en vez de escribir directamente la URL en la barra de direcciones o pulsar uno de sus marcadores (la probabilidad de navegar directamente a otra web aleatoria es 1-d).

El factor de amortiguación reduce el peso de todas las páginas de Internet y consigue que las páginas que no tienen enlaces a ninguna otra página no salgan especialmente beneficiadas.

Como se comentó con anterioridad, el peso o importancia de una página es el resultado de una “votación” entre todas las demás páginas de la Red acerca del nivel de importancia que tiene esa página. Un hiperenlace a una página cuenta como un voto de apoyo.

El PageRank de una página depende del número y PageRank de todas las páginas que la enlazan, por lo que una página está enlazada por muchas páginas con un PageRank alto consigue también un PageRank alto. Del mismo modo, si una página no es enlazada por otras, no contará con apoyo.

El PageRank de la barra de Google va de 0 a 10, en una escala supuestamente logarítmica (sin embargo, al no conocerse con exactitud el algoritmo, no se puede determinar la veracidad de esta suposición). Diez es el máximo PageRank posible y son muy pocos los sitios que gozan de esta calificación, 1 es la calificación mínima que recibe un sitio normal, y cero significa que el sitio ha sido penalizado o aún no ha recibido una calificación de PageRank.

Anuncios

Entry filed under: Telecomunicaciones. Tags: , .

TETRAPOL WLAN, parte 1

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Trackback this post  |  Subscribe to the comments via RSS Feed


abril 2009
L M X J V S D
« Mar   May »
 12345
6789101112
13141516171819
20212223242526
27282930  

Twitteando

Páginas

Miscelánea

Add to Technorati Favorites

A %d blogueros les gusta esto: