¿Qué es el PageRank?

pagerank-google

PageRank (PR) es un valor numérico que representa la importancia que una página web tiene en Internet. Google se hace la idea de que cuando una página coloca un enlace (link) a otra, es de hecho un voto para esta última. Cuantos más votos tenga una página, será considerada más importante por Google. Además, la importancia de la página que emite su voto también determina el peso de este voto. De esta manera, Google calcula la importancia de una página gracias a todos los votos que reciba, teniendo en cuenta también la importancia de cada página que emite el voto.

PageRank (desarrollado por los fundadores Larry Page y Sergey Brin) es la manera que tiene Google de decidir la importancia de una página. Es un dato valioso, porque es uno de los factores que determinan la posición que va a tener una página dentro de los resultados de la búsqueda. No es el único factor que Google utiliza para clasificar las páginas, pero sí es uno de los más importantes.

Hay que tener en cuenta que no todos los links son tenidos en cuenta por Google. Por ejemplo, Google filtra y descarta los enlaces de páginas dedicadas exclusivamente a colocar links (llamadas ‘link farms’).

Además, Google admite que una página no puede controlar los links que apuntan hacia ella, pero sí que puede controlar los enlaces que esta página coloca hacia otras páginas. Por ello, links hacia una página no pueden perjudicarla, pero sí que enlaces que una página coloque hacia sitios penalizados, pueden ser perjudiciales para su PageRank .

Si un sitio web tiene PR0, generalmente es una web penalizada, y podría ser poco inteligente colocar un link hacia ella.

El algoritmo de ‘PageRank™ ‘ fue patentado en Estados Unidos el día 8 de enero de 1998, por Larry Page. El título original es ‘Method for node ranking in a linked database‘, y le fue asignado el número de patente 6,285,999.

pagerank

PageRank, mucha matemática

El valor del PageRank que observamos es un valor comprendido entre 0 y 10. Pero en realidad, el PageRank es un valor numérico mucho más alto, calculado en función de los enlaces que reciben nuestras páginas.

El valor real suele ser del orden de miles de unidades. Sin embargo, Google toma su valor logarítmico para hacerlo visible a los usuarios. La base de este logaritmo es desconocida.

Por ejemplo, para una base 7, tendríamos los siguientes valores:

Valor PR PR Real
0 0 – 3
1 3 – 19
2 19 – 130
3 130 – 907
4 907 – 6351
5 6351 – 44458
6 44458 – 311209
7 311209 – 2178466
8 2178466 – 15249262
9 15249262 – 106765607
10 > 106765607

Si una página tiene un PageRank real -por ejemplo- de 500.000, ¿qué valor le trasmitiría a otra a la cual enlaza?.

La respuesta a esta pregunta se contesta en el ya famoso texto de Sergey Brin y Larry Page (fundadores de Google), llamado ‘ The Anatomy of a Large-Scale Hypertextual Web Search Engine‘.

En él, planteaban la siguiente fórmula para calcular el PageRank de una página web llamada ‘A’:

PR(A) = (1-d) + d * [ PR(T1)/C(T1) + ... + PR(Tn)/C(Tn) ]

Donde:
- ‘d‘ es el factor de atenuación. Un valor podría ser 0,85
- ‘Ti‘ es cada página que enlaza a ‘A’. ‘i’ toma los valores 1, 2, … hasta ‘N’. ‘N’ es el número de páginas que enlazan a ‘A’.
- ‘PR(Ti)‘ es el PageRank de cada una de las páginas que enlazan a ‘A’.
- ‘C(Ti)‘ es el número de enlaces que salen desde cada página ‘Ti’.

Por lo tanto, nuestra página de 500.000 de PageRank transmitirá a otra en caso de tener un único enlace, un valor de 0,85*500000 = 425.000. Generalmente las páginas poseen más de un enlace dentro de ellas, así que este valor habría que dividirlo entre el número de enlaces.

Como se puede comprobar, el valor del PageRank de cada página no es constante en el tiempo, ya que depende de los enlaces que vayamos recibiendo y, a su vez, del PR de las páginas que nos enlazan.

Por ello, una vez al mes aproximadamente, Google recalcula el valor de este PageRank en lo que viene a llamar la ‘ Google Dance ‘.

profesionalnet-disenoweb1