El abandono del blog puede derivar en que ya nadie lea esta entrada, pero sigo siendo optimista. La mayoría de los hipóteticos lectores sabrán que recientemente cambié los ventosos desiertos de Zaragoza por las soleadas playas de Barcelona.
Una de las principales razones de esta decisión fue profesional y ha conducido a tener que adaptarse a nuevos entornos sin perder los intereses anteriores. Estos cambios como Ingeniero en Informática incluyen gestionar nuevos tipos de datos en diferentes lenguajes de programación, en concreto Python. Para dar los primeros pasos me he ayudado de un tutorial para iniciados muy recomendable. Al contar con licencia de Creative Commons me dispongo a compartirlo con todos vosotros. El autor, Raúl González Duque, ha elaborado un manual muy didáctico y bien estructurado.
Por otro lado, está el tema de las estructuras de datos, particularmente grafos. Una reacción esperada de un aficionado a Hadoop es la de buscar estrategias para aprovechar su potencial. Ya hace meses había encontrado el libro de Jimmy Lin “Data-Intensive Text Processing with MapReduce”. En el quinto capítulo muestra una representación MapReduce para grafos y algoritmos clásicos como Recorrido en anchura y PageRank. Esta semana también descubrí otros diseños como la representación vértice-arista-vértice o estrategias para que el criterio de particionado+replicación+ubicación de los datos dependa de la estructura del grafo.
Sin duda, es agradable que se estén dedicando esfuerzos a orientar tecnologías tan potentes como Hadoop para este entorno. Sin embargo, me planteo si estas líneas de investigación están abiertas por un fenómeno de fanboy. Existen excelentes tecnologías diseñadas para procesar grafos (por ejemplo Neo4j) y, pese a mi corta experiencia como informático, sigo siendo muy escéptico ante una posible panacea computacional…
P.D. Si has llegado a este post por una búsqueda relacionada con la escalabilidad puede que te interese unirte a este grupo Google: https://groups.google.com/group/spain-scalability-users
P.D.2. Ya que estamos con enlaces, el próximo 24 de agosto se celebra un webminar sobre el futuro de Hadoop impartido por su creador (Doug Cutting) y el fundador de Cloudera (Jeff Hammerbacher): https://www1.gotomeeting.com/register/707543209
One thought on “Cambio de aires”