viernes, 8 de febrero de 2008

El mundo según Page ...

Para los que no sabían, la historia de Google nace como tesis de doctorado (si la mía es 1% de la de ellos, seré millonario), dos estudiantes de Stanford diseñaron un buscador de internet, que tenia como idea original, lograr encontrar un patrón que represente la real importancia que tiene un sitio. Como medir la importancia, (sin ser relativista) es la idea de este posteo ...

Supongamos que como estudiantes de doctorado que somos, tenemos que analizar, leer y generar nuevo conocimiento sobre el estado (en la frontera) de la ciencia que nos especialicemos. Generalmente el prestigio de los académicos, se mide por la cantidad de papers publicados y a su vez por la cantidad de citas que esos papers tenían. La ciencia que estudia las citas se llama bibliométrica y su San Martín es J.M Kleinberg (el HDP tiene mi edad, un pendex), para medir la relevancia de un documento científico se usa el factor de impacto de Garfield, el cual relaciona linealmente la cantidad de papers que citan un determinado trabajo los dos años posteriores a su publicación (mas o menos es eso). Ahora, como siempre, un ejército de otras personas lo critican (los mas representativos son Pinski y Narin) y dicen que en realidad este factor, no tiene en cuenta la importancia de quien cita y de entre quienes se citan.

A la cita del paper, tenemos que hacerle la segunda derivada (maldito Walras, meter las leyes de optimización de la física a la economía) y encontramos el comentario, por ejemplo, yo podría citar el libro de John Battelle y decir que me inspiró a escribir este post, pero que su tesis estaba errada por que carecía de rigor científico (no es así, pero para el ejemplo va), o sea, el comentario es un juicio de valor sobre un artículo citado. Finalmente a la cita y su juicio de valor sobre ella (el comentario) tenemos que ponerle una categoría, la categoría se refiere a cuanto se cita, como se cita y quien te cita, la combinación de esas cosas, da como resultado una especie de categoría, ordenando los mejores por sobre el resto (no queda lindo poner peores).

Si entendieron estas tres cosas, lo que viene es como Google, ordena la web y generar sus resultados. Page pensó los enlaces como citas académicas y los comentarios como la información asociada a ese enlace. Hasta 1995, esto eran los buscadores, lo diferente del modelo de Page era que una vez que tenía toda esta información, para encontrar la importancia de cada uno de ellas, invirtió el recorrido de los enlaces, uniendo, no quien cita a quien (en términos de papers) sino quienes citan a los que son citados (parece un trabalenguas, pero es así, matemática de redes viejo).

La importancia de quien te cita termina indexando la web, si este Blog fuera visto por no mucha gente, pero esta gente proviene de páginas con muchas visitas, la posición de mi blog subiría potencialmente (no es un error se multiplicaría por el factor que crece, en otro post explicamos la ley de potencias e internet).

Hasta la próxima, lectores

No hay comentarios:

¿Como calificas este Blog?