I Taller de
Bioinformática
19 de mayo de 2004
MACN - Buenos Aires
Programa
| 14:00-14:30 hs. | Introducción general y presentación de los participantes | Javier Beltrán y Alejandro Tablado |
| 14:30-14:50 hs. | Repaso breve de lo comprometido en el ámbito del Proyecto GBIF. Esquema de trabajo acordado en al ámbito de las instituciones piloto | Javier Beltrán |
| 14:50-15:10 hs. | Aporte de SECyT/CONICET al desarrollo informático de la RNCB | ausente con aviso |
| 15:10-15:40 hs. | Sistema de Información sobre Biodiversidad de la Administración de Parques Nacionales | M.Sc. Daniel Somma |
| 15:40-16:10 hs | Base de datos Biótica: resultado inicial de su aplicación en el ámbito de colecciones zoológicas piloto (Reptiles UNNE) | María Fernanda Golobisky |
| 16:10-16:30 hs. | Intervalo y café | |
| 16:30-17:00 hs. | Base de datos Iris: resultado de su aplicación en el ámbito de los herbarios piloto (Darwinion, IMBIV, IBONE, INTA) | Daniel Rodríguez |
| 17:00-17:30 hs. | Adopción de Biótica como modelo para elaborar base de datos propias | Mariano Merino |
| 17:30-18:00 hs. | MACN, adaptación de Biótica al entorno Lynux | Gustavo Presta y Alejandro Tablado |
| 18:00-18:50 hs. | Registro de bases de datos - Programa DiGIR | Mariano Merino |
| 18:50-19:00 hs. | Conclusiones generales | |
| 19:00 hs. | Vino de camaradería |
Informe de
Resultados
por Javier Beltrán
El taller formó parte de las actividades previstas en el Proyecto “Red Nacional de Colecciones Biológicas: conjuntos de datos pilotos y fondo semilla para disparar la distribución electrónica de información sobre biodiversidad en la Argentina”, que recibe financiamiento del GBIF. Los objetivos del taller fueron los siguientes:
Revisar lo conseguido en cuanto a la informatización de los 22.000 datos comprometidos por las diez instituciones piloto, como parte del acuerdo firmado en septiembre de 2003;
Definir líneas comunes de acción y un plan para profundizar el intercambio de experiencia y tecnología entre las colecciones; e
Identificar los problemas que dificultan el cumplimiento del compromiso asumido con el GBIF, en cuanto al registro de las bases de datos que contengan al menos 213.000 registros a fines de 2004 (mediante el uso del paquete DiGIR).
En el Anexo I se incluye el programa del taller en el que participaron 30 personas en representación de 14 instituciones de todo el país (Anexo II).
Los resultados más destacados de la reunión se pueden resumir en los siguientes puntos:
Se observa un gran avance en la formulación de estrategias institucionales de informatización de datos básicos sobre especimenes y otras muestras biológicas. Todas las instituciones participantes han logrado un significativo progreso en la planificación y el desarrollo de un sistema moderno para la captura y el procesamiento de información sobre biodiversidad.
El avance conseguido hasta ahora va en línea con las expectativas planteadas en el Proyecto GBIF pero tiene características heterogéneas. Esta condición, sin embargo, le brinda una enorme riqueza y permite la búsqueda de opciones conceptuales y técnicas que confluyan lentamente a la definición de una estrategia consolidada para la totalidad de la RNCB.
Algunos de los enfoques encarados por las instituciones son los que se detallan a continuación:
Desarrollo de software propio: el MLP y la Facultad de Informática de La Plata se han asociado para la definición de un paquete informático que se ajuste a las necesidades de los curadores. La base conceptual surgió del análisis de Biótica, pero el sistema informático definitivo será propio y servirá para capturar información de todas las colecciones residentes en el MLP. El desarrollo de la base de datos comprendió un proceso de discusión del marco conceptual que culminó en la definición de las tablas y los campos básicos, y la relación entre ellos. La captura de datos en la nueva base se hará en bloque (bases preexistentes) o gradualmente, en el caso de aquellas colecciones que todavía no han sido informatizadas. Presentaron el Dr. Mariano Merino (Colección Mastozoología, MLP) y el Dr. Hugo Ramón (Facultad de Informática, UNLP)
Adopción de Biótica I: las colecciones de Herpetología y Paleontología de la UNNE trabajan aunadamente para adoptar la base Biótica. Realizaron un análisis de la estructura y las prestaciones de esta base, con el fin de proceder a su utilización por parte de los “capturistas”. El análisis ha tenido no pocos desafíos, que han sido resueltos con paciencia y una consulta continua a los técnicos de CONABIO. El uso de Biótica para la colección Paleontológica ha sido solventado a través de la inclusión de nuevos campos en módulos precargados de la base. Presentaron la Lic. María Fernanda Golobisky y el Lic. Miguel Regnet (Colección Herpetología, UNNE) y la Lic. Claudia Lovera (Colección Paleontológica, UNNE).
Adopción de Biótica II: el MACN sigue la misma estrategia que la UNNE, aunque en un entorno Lynux. La adaptación de la base al software libre no es inmediata, ya que necesita la incorporación de elementos que permitan que los programas corran y las tablas puedan ser modificadas. Apenas se resuelvan estos aspectos, se procederá a la migración en bloque de bases preexistentes en Access y a la captura gradual de datos en formato analógico. Presentaron el Lic. Alejandro Tablado (Curador General, MACN) y el Sr. Gustavo Presta (Técnico Informático, MACN).
Adopción de Iris: el Instituto Darwinion promueve el concepto de uso de una base de datos run-time, esto es, la circulación de un programa precargado para incorporar bloques de datos predefinidos. La estrategia involucra a un conjunto de herbarios y colecciones botánicas que aprovechan el espacio reservado y vuelcan datos que después son remitidos al Instituto para su incorporación a la base de datos “madre”. El sistema demanda una buena inversión de tiempo de parte del coordinador, en especial en lo que se refiere al chequeo de los datos brindados por las instituciones. No dispone, al menos por ahora, de una opción de carga “a distancia”. De cualquier manera, se ha logrado un avance notable en la captura de registros, lo que representa una importante contribución al “pool” general de datos. Presentó el Ing. Daniel Rodríguez (Coordinador de Iris del Instituto Darwinion)
Adopción de bases de datos comerciales: otras instituciones que participan en el Proyecto GBIF han decidido proseguir con el uso de bases preexistentes elaboradas con el programa Access (u otros paquetes comerciales). Entre estas se encuentran las colecciones residentes en la Fundación Miguel Lillo y otras, como las del CENPAT. Si bien el avance en la captura es destacado, resta por analizar el grado en que las bases responden a los estándares internacionales promovidos por el GBIF, lo que espera realizarse en la segunda etapa del proyecto. Presentaron la Dra. María Rosa Figueroa y el Ing. Federico de Zavalía (FML) e informó el Dr. Atila Gostonyi (CENPAT).
Cooperación con otras iniciativas de manejo de información: el M.Sc. Daniel Somma, de la Administración de Parques Nacionales, presentó los antecedentes institucionales del Proyecto Sistema de Información de Biodiversidad (SIB), que recibe financiamiento del Fondo para el Medio Ambiente Mundial (FMAM). Daniel describió el camino seguido por el SIB desde los inicios en 1996, detalló los cambios que se están haciendo para que cumpla con los objetivos planteados en el proyecto original y analizó las alternativas que existen para integrarlo a los esfuerzos que, como el del Proyecto GBIF, buscan generar volúmenes crecientes de datos básicos sobre la biodiversidad. De esta presentación surgieron algunas alternativas para establecer experiencias integradoras entre ambas iniciativas.
Las recomendaciones principales surgidas del taller son las siguientes:
Intercambio entre técnicos de distintas colecciones: la variedad observada de enfoques institucionales incrementa los potenciales beneficios de realizar un intercambio interinstitucional fluido que facilite, en la medida de lo posible, la transferencia de tecnología y experiencia entre los coordinadores del Proyecto GBIF. El intercambio tiene que ser amplio e involucrar no sólo la circulación electrónica de documentos y protocolos, sino también las visitas de capacitación programadas de institución a institución.
Definición de un conjunto de estándares mínimos: un paso previo necesario para lograr la diseminación amplia de los datos colectados consiste en la definición de un conjunto de estándares mínimos (geográficos, taxonómicos, curatoriales, etc.) que sean compartidos por todas las colecciones. Esto no implica necesariamente un enorme esfuerzo en términos de tiempo (puede hacerse como parte del II Taller de Bioinformáticos, ver más adelante), sino más bien una inmejorable oportunidad para realizar un esfuerzo de planificación conjunta que luego se puede extender a otros parámetros. La propuesta fue sugerida por Daniel Somma, de APN, y serviría para encontrar alternativas que involucren a instituciones que no forman parte de la RNCB.
Registro de las bases de datos con DiGIR: este programa es el que es promovido por el GBIF para el registro de bases de datos de estándares reconocidos a escala internacional. En principio, la aplicación de este paquete requiere la aplicación de protocolos y estándares cuya comprensión no es sencilla (Darwin Core o ABCD Schema). Es preciso llevar a cabo una práctica breve de instalación y uso del programa con la supervisión de Mariano Merino, quien participó del taller realizado en el INBio de Costa Rica, en noviembre del año pasado.
Constitución de un equipo informático propio: esta es una recomendación de largo plazo, pero que es esencial para que todas las instituciones formalicen una estrategia abarcadora de manejo del conocimiento sobre la biodiversidad. Las opciones son varias: desde la formación de asociaciones como la que llevan a cabo el MLP y la UNLP, hasta la designación de informáticos (del Conicet, la Secyt, etc.) en las instituciones de la Red.
Elaboración de una propuesta para adoptar un enfoque de código abierto: el tema de licenciamiento de los paquetes comerciales no es menor. Julio Tillería recomendó que las instituciones se empiecen a esforzar en el desarrollo de soluciones informáticas que trabajen con el concepto de código abierto (“open source”). El uso extendido de este tipo de programas reducirá los problemas asociados a la falta de financiamiento crónico de las instituciones de la Red y disminuirá la posibilidad de que existan “callejones sin salida” tecnológicos.
Realización de un II Taller de Bioinformáticos: la enumeración de las recomendaciones aquí señaladas sirve para resaltar la necesidad de realizar una segunda reunión de bioinformáticos en el menor plazo posible. El Dr. Edgardo Romero ofreció al MACN como sede de este segundo taller, que tendría lugar hacia fines del mes de junio.
Lista de participantes
|
Nombre |
Institución |
|
|
Dra. Mirta Arriaga |
MACN |
|
|
Lic. Federico Bava |
APN |
|
|
M.Sc. Javier Beltrán |
MACN |
|
|
Ing. Federico Barrada de Zavalía |
FML |
|
|
Dr. Luis Compagnucci |
MACN |
|
|
Lic. Fabiana Cuezzo |
INSUE |
|
|
Lic. Hernán Dinapoli |
MACN |
|
|
Dra. María Rosa Figueroa Roman |
FML |
|
|
Lic. María Fernanda Golobisky |
UNNE (Herpetología) |
|
|
Dr. Roberto Gómez Cadret |
MACN |
|
|
Dr. Atila E. Gosztonyi |
CENPAT |
|
|
Dr. María Graziani |
APN |
|
|
Prof. Martín Izquierdo |
APN |
|
|
Dra. Mónica Inés Longobucco |
MACN |
|
|
Lic. Claudia Lovera |
UNNE (Paleontología) |
|
|
Dr. Mariano L. Merino |
MLP |
|
|
Ing. Ramón Palacios |
FCEN |
|
|
Sr. Gustavo Presta |
MACN |
|
|
Dra. María Cecilia Puigbó |
IBONE |
|
|
Dr. Hugo Ramen |
UNLP |
|
|
Dr. Martín Ramírez |
MACN |
|
|
Lic. Miguel Regnet |
UNNE (Herpetología) |
|
|
Dr. Edgardo Romero |
MACN |
|
|
Ing. Daniel Rodriguez |
Instituto Darwinion |
|
|
Dr. Virgilio Roig |
IADIZA |
|
|
Dra. Cristina Scioscia |
MACN |
|
|
M.Sc. Daniel Somma |
APN |
|
|
Lic. Alejandro Tablado |
MACN |
|
|
Lic. Julio Tillería |
CIRN-INTA |
|
|
Dr. Edgardo Tremouilles |
MACN |