Los robots y los enlaces en el periodismo que viene
En octubre pasado en las conversaciones que se dieron en el entorno de la reunión de la SIP de Madrid tomamos conciencia solo de la gravedad que tendría para los diarios el impacto del tsunami digital que ya entonces provocaba sus primeros efectos graves en los Estados Unidos. Para esa reunión yo había sumado a la reunión a un profesional que conocí en los 90 en Pamplona, Mario Tascón. En su presentación Mario fue tremendamente negativo respecto al futuro de los diarios tradicionales: la título “Cómo acabar con los diarios de una vez por todas”.
En el seminario realizado en octubre el Instituto de Empresa en Madrid, Mario Tascón (al fondo) y Ismael Nafría (en primer plano), modera el autor del post.
A Mario lo conocí como infografista cuando trabajé en la Universidad de Navarra, luego seguí su trabajo liderando el exitoso sitio digital del diario El Mundo de Madrid, posteriormente todos supimos de su sonado cambio a El País, cuando el diario de Prisa asumió el fracaso de su estrategia inicial de cobrar por el acceso a internet. El año pasado cuando realizamos el seminario se encontraba liderando un proyecto 100% digital.
Una anécdota que oí en esos días y, pienso, refleja muy bien la crisis que se venía incubando en la prensa: Rosenthal Calmon Alves había organizado en el 2007 para la SIP una mesa con los principales medios digitales de diarios tradicionales, un año después los tres directivos que había elegido para esa mesa redonda ya habían renunciado a sus trabajos en la prensa tradicional para sumarse a proyectos 100% digitales, Mario era uno del grupo.
Desde entonces he estado en contacto “virtual” con el proyecto de Tascón, de hecho en este mismo espacio, en el mismo mes de octubre, comenté con él mis opiniones sobre las revistas digitales construídas sobre flash. La forma de mantener ese contacto fue por meses el completísimo blog 233 grados con el que el grupo desarrolló sus primeros trabajos, luego vino Prácticopedia.
En el blog conocí lo que me llevó a valorar realmente lo que estaban desarrollando, el documento que ellos titularon la filosofía del triángulo: “Tenía que ser un medio donde hubiera buenos periodistas que hiciesen buenas historias, donde los usuarios fueran más allá de la participación convencional y donde las máquinas, obviamente instruidas por expertos, fuesen capaces de seleccionar y jerarquizar contenidos dispersos por la Red. Más que un medio, un hipermedio”.
Al menos en la declaración de principios del proyecto se entiende que hay que mantener el foco en la redacción de buenas historias y se valora la importancia de apostar por potenciar radicalmente la participación, ya no como un espacio a terceros, sino como ingrediente clave en la producción de los medios que vienen, “a varias manos”. Ahí estaban los dos temas que permanentemente hablamos en este blog, el último en especial desde que en el 2007 hablé del libro de Jenkins Convergence Culture que lanzamos con él en Chile el año pasado.
Pero lo más novedoso del proyecto era la relevancia del tercer vértice, el mismo que ha provocado más discusión en estos días, ya que alude a una de las grandes polémicas de la industria de medios que viene (Google vs Associated Press): la importancia de los robots (arañas, crawlers) en el trabajo periodístico para agrupar enlaces (links) de otros medios.
Para mi esto es un tema clave en el periodismo que viene. Desde que en enero de este año decidí que me iba a concentrar en el 2009 en las actividades digitales de la información estoy trabajando cerca de varios proyectos que usan estas tecnologías. Uno que me tiene entusiasmado es el creado por mi ex alumno y compañero en la escritura del libro sobre Blogs que lanzaremos este viernes 24 de abril en el Viernes de Medios de la UC, Tomás Pollak. Con Tomás me ha tocado explicar ya como socio el proyecto Tugar, en que sus “arañas” agrupan toda la oferta de propiedades de Chile que existe en internet y las vuelcan en los mapas de Google, todo esto con una interfaz que sé que Jeff Jarvis definiría como elegante. En esa misma línea de apoyar proyectos visionarios ahora trabajo con la gente de Reactor un proyecto parecido relacionado con reputación digital de nombres como de marcas realizado por las misma empresa responsable de dos proyectos recientes muy bien logrados: públicaopinión, la nueva cara de podcaster y en estos días de el diario urbano para universitarios que está trabajándose con MSN: KmCero.
Con estas experiencias con las famosas arañas entendí que los medios que vienen tienen que asumir el trabajo de “mostrar” lo “que hay que leer” de otras latitudes y esto se debe hacer mediante enlaces como lo que me tocó ver el el trabajo beta de lainformación.com. De ellos se dijo “El sitio está armado con tecnología robótica. Al parecer trae feeds desde diversas fuentes, clasifica artículos y los presenta completos en categorías, ordenando por tiempo, visitas, recomendaciones , etc”. Cuando se lanzó la versión beta inmediatamente se dió la polémica en los blogs chilenos: mientras Rodrigo Guaiquil (de BNAméricas) defendió el trabajo “semántico” que se realizaba el nuevo proyecto, por el otro bando saltó Ignacio Rodriguez (@micronauta) para desacreditar el valor agregado del nuevo medio: “Estuve examinando el beta privado de lainformacion.com, y si bien la idea me pareció un ejercicio interesante de tecnología, no logré hallar el valor desde el punto de vista del usuario” afirmó en un post con el que yo polemicé en la semana.
Para Ignacio la línea que separa lo que se puede hacer en el periodismo sin pasar a llevar los derechos de otro medios se define entendiendo que “Una cosa es linkear noticias en otros medios, otra cosa muy diferente es hacer scraping (nota del autor: scraping es la práctica de algunos blogs de copiar y pegar contenido) de artículos completos”. En su blog yo discutí sus críticas en su misma línea: “pienso que si un medio destaca un artículo de otro medio y no interfiere en que ese enlace lleve al lector al medio original, al creador de la información, no hay un problema. Es lo que hacen Newser o el mismo Huffington Post en casi todas sus noticias. Distinto es el medio que realiza un “cut and paste” de una información o la re escribe con ajustes para ponerla en su sitio obligando a que la gente lea ese contenido en el medio que no realizó el trabajo periodístico”.
Pienso que atrás de estas opiniones había una polémica artificial condicionada con la idea del nuevo medio español de lanzar su Beta mostrando solo este polémico tercer vértice del triángulo. Ellos lanzaron el beta para hacer andar los robots con público, pero como se trata de un medio cerrado (con clave diaria) todavía no tienen participación de la audiencia y es tímido lo que están haciendo sus periodistas e infografistas.
Le mandé un mensaje a Mario para saber qué pensaba de lo que se podía y no se podía hacer respecto al trabajo de otros medios y me contestó inmediatamente una respuesta que confirmó que respetaba los mismos límites que aludí en el blog de Ignacio:”Nosotros no hacemos scraping: publicamos aquellos materiales sobre lo que tenemos derechos, que incluye, como muchos medios, agencias informativas en texto, fotos y videos”.
“Además agregamos los titulares de blogs, como de otros medios y de fuentes oficiales. Todo ese material pasa por sistemas semánticos de etiquetación que colocan automáticamente las noticias en las categorías a las que corresponden.
Cada página de una categoría jerarquiza automáticamente el material, es decir intenta resaltar aquello que es más importante (ya sé que eso es subjetivo, pero lo intenta). Sospecho que el autor del blog ha visto sólo los dos primeros días la beta y allí había, sobre todo, titulares porque las noticias de las agencias todavía no habían entrado, por eso ha podido pensar en la lectura de RSS”. Mario comentó que justamente “Para esas cosas son las betas. Para probar”.
Además me comentó: “En cualquier caso para vuestro conocimiento lainformacion.com procesa cada día (de momento) unos 20.000 objetos informativos, de los que descartamos unos 5.000 por repeticiones (la mayoría de los medios publica las mismas noticias de las agencias). De esas 15.000 restantes seleccionamos unos 10.000. La mayoría son agencias de las que tenemos derechos (Reuters, EFE, etc) pero, a diferencia de otros medios, no cortamos ni pegamos nada porque todo el proceso de recepción, catalogación y publicación es automático. También el de jerarquización como he dicho antes (que es uno de los más complejos matemáticamente). Adicionalmente en cada categoría se monitoriza también la actividad de twitter sobre ese asunto. Falta todavía la intervención de la redacción que recién está empezando, poco a poco y en paralelo a otras pruebas, ayer comenzamos a introducir material propio. Con el tiempo se dedicarán solo a eso ya que, a diferencia de otros medios, los periodistas de lainformación están liberados de las labores burocráticas que atenazan a los digitales (cortar, copiar y editar el material de agencias o procedente de las ediciones analógicas del medio original)”.
¿Qué opinan ustedes?
PD: Cuando estaba en la redacción final de este blog, me quedó dando vueltas la opinión que me dió ayer un empresario que ha sido líder en el trabajo chileno en internet con el que me junté por aquello de buscar inversionistas para los proyectos de mis ex alumno. Me advirtió en un tema análogo que no teníamos que centrar la nueva empresa en desarrollar el software, que este nunca iba a terminar de perfeccionarse, que al final ese proceso no se alcanzaba. Convenía empezar a trabajar en un proyecto informativo entendiendo que las “arañas” serán empresarialmente eficientes si realizan solo la base del trabajo pero se les deja a periodistas la sintonía fina, para él hacer lo contrario nos llevaría o a no tener el proyecto a tiempo o a invertir demasiado en ese desarrollo.