Limpiando los datos

38.000 valores históricos de PageRank eran demasiados para las 3.000 URLs y pico que almacena PageRankAlert.com… era hora de hacer limpieza de datos y ahora la aplicación va a simplificar el historial de PageRank de las páginas.

El primer patrón basura que he detectado es del tipo x,0,x … o sea, por ejemplo una web con PR 5 cae a PR 0 y al día siguiente vuelve a subir a donde estaba, PR 5… A veces este patrón es del tipo x,-1,x. Considero estos casos como fallos al consultar el PR, así que los simplificamos y una serie de tipo x,0,x,0,x,y… se quedará simplemente en x,y.

Por ahora parece que va quedando bien. Veamos el antes y el después del historial de www.jaimeiniesta.com:

Antes:

Antes

Después:

Después

1 comment so far ↓

#1 eTrueke on 05.05.07 at 10:32 am

Eso es buena idea, porque he visto algunos gráficos un poco engorrosos.

Por cierto parece que desde hace 18 días no actualiza los PR.

Un saludo

Leave a Comment