lunes, 11 de febrero de 2008

Wikitopías ...

Será una utopía (vean el link, por que me sorprendió de donde viene la palabra, mi luna de miel fue en la isla que inspiró el término) pensar que el mundo (entiéndase la sociedad), pueda autorregularse, sin la necesidad de un poder que nos imponga leyes (buenas o malas)? Este pensamiento, que en algún punto roza lo "tira bomba", puede ser el camino correcto de las sociedades en los siglos venideros?

Si hacemos como en Matrix y tomamos la píldora azul, nada cambiará. Ahora si tomamos la píldora roja y nos abrimos a interpretar la realidad, podemos descubrir cosas realmente asombrosas, extrañas y hasta en algún punto "locas" (invocando a Paolo el rockero).

Wikipedia, nació en 2001 de la mano de Jimmy Wales, con una idea revolucionaria, que el conocimiento colectivo no regulado, cree una enciclopedia que compita con la Biblioteca de Alejandría. La idea, es que cada persona (sin ningún tipo de control) pueda escribir a su antojo sobre el tema que se le ocurra. En este contexto, lo primero que pensaría cualquier persona (del mundo occidental, al menos) es que sería una basura, que no funcionaría y que los datos que se incluiría no serán relevantes para poder competir con una enciclopedia real, como la Británica.

Pues bien, como muchas veces en la historia, la mayoría occidental, se equivocó. Si comparamos una enciclopedia tradicional, con wikipedia, vemos por ejemplo que las personas que "auditan" el contenido en la enciclopedia Británica en su mayoría son PHD, mientras en wikipedia no sabemos que, ni quienes son (aunque hay muchos PHD), la enciclopedia Británica tiene aproximadamente 80.000 artículos, wikipedia tiene 9.000.000, 2.000.000 en inglés y casi 400.000 en español, en mas de 250 idiomas diferentes. Ahora, semejante diferencia podría hacer que la información de los 80.000 artículos de la Británica sea correcta (como sabemos hay errores, los cuales se corrigen solo en la siguiente edición impresa) y los 9.000.000 de los de wikipedia tengan mucha basura. Una persona que se resiste al cambio (entender que el proceso de construcción de enciclopedias evolucionó, que ahora es mucho mas eficiente y veraz, dejar que se construya sola), diría que no puede confiar en algo que no tiene un "control" por parte de personas idóneas para ejercerlo (un pensamiento Straussiano, y a mi criterio retrógrado).

Gracias a la píldora roja, y al libro "Out of Control" de Kevin Kelly (los hermanos Wachowski se inspiraron en ese libro para Matrix, y en muchos otros) sabemos que en los sistemas caóticos, como el vuelo de los pájaros, el orden proviene del caos, invirtiendo la dirección de la entropía. Esta idea sustenta la tesis que la inteligencia emerge, en estos sistemas, autorregulándose y como su comportamiento es probabilístico, está diseñada (sin nadie que la piense, sino que la interacción hace el diseño) para que evolucione y mejore con el mayor número de interacciones.

Es decir, en Wikipedia no todos los 9 millones de artículos están bien, pero la probabilidad de encontrar uno malo es mucho mas chica que en la Británica (por la base, 80.000 vs 9.000.000): En la "enciclopedia viviente", como en nuestro sistema inmunológico, existe un enorme ejército de guardianes, siempre dispuesto a responder a ataques de virus extraños. A modo de ejemplo una entrada maliciosa en la palabra Islan, tarda menos de 3 minutos en corregirse. Con lo cual, a medida que mas gente utilice el sistema, mejor será, el uso mejora el contenido.

Señores, créanlo o no, bienvenidos al mundo autoregulado y sin control ... "wake up NEO, the Matrix has you"

Hasta la próxima lectores ....

viernes, 8 de febrero de 2008

El mundo según Page ...

Para los que no sabían, la historia de Google nace como tesis de doctorado (si la mía es 1% de la de ellos, seré millonario), dos estudiantes de Stanford diseñaron un buscador de internet, que tenia como idea original, lograr encontrar un patrón que represente la real importancia que tiene un sitio. Como medir la importancia, (sin ser relativista) es la idea de este posteo ...

Supongamos que como estudiantes de doctorado que somos, tenemos que analizar, leer y generar nuevo conocimiento sobre el estado (en la frontera) de la ciencia que nos especialicemos. Generalmente el prestigio de los académicos, se mide por la cantidad de papers publicados y a su vez por la cantidad de citas que esos papers tenían. La ciencia que estudia las citas se llama bibliométrica y su San Martín es J.M Kleinberg (el HDP tiene mi edad, un pendex), para medir la relevancia de un documento científico se usa el factor de impacto de Garfield, el cual relaciona linealmente la cantidad de papers que citan un determinado trabajo los dos años posteriores a su publicación (mas o menos es eso). Ahora, como siempre, un ejército de otras personas lo critican (los mas representativos son Pinski y Narin) y dicen que en realidad este factor, no tiene en cuenta la importancia de quien cita y de entre quienes se citan.

A la cita del paper, tenemos que hacerle la segunda derivada (maldito Walras, meter las leyes de optimización de la física a la economía) y encontramos el comentario, por ejemplo, yo podría citar el libro de John Battelle y decir que me inspiró a escribir este post, pero que su tesis estaba errada por que carecía de rigor científico (no es así, pero para el ejemplo va), o sea, el comentario es un juicio de valor sobre un artículo citado. Finalmente a la cita y su juicio de valor sobre ella (el comentario) tenemos que ponerle una categoría, la categoría se refiere a cuanto se cita, como se cita y quien te cita, la combinación de esas cosas, da como resultado una especie de categoría, ordenando los mejores por sobre el resto (no queda lindo poner peores).

Si entendieron estas tres cosas, lo que viene es como Google, ordena la web y generar sus resultados. Page pensó los enlaces como citas académicas y los comentarios como la información asociada a ese enlace. Hasta 1995, esto eran los buscadores, lo diferente del modelo de Page era que una vez que tenía toda esta información, para encontrar la importancia de cada uno de ellas, invirtió el recorrido de los enlaces, uniendo, no quien cita a quien (en términos de papers) sino quienes citan a los que son citados (parece un trabalenguas, pero es así, matemática de redes viejo).

La importancia de quien te cita termina indexando la web, si este Blog fuera visto por no mucha gente, pero esta gente proviene de páginas con muchas visitas, la posición de mi blog subiría potencialmente (no es un error se multiplicaría por el factor que crece, en otro post explicamos la ley de potencias e internet).

Hasta la próxima, lectores

¿Como calificas este Blog?