Spanish English
  • facebook footer
  • twitter footer
  • youtube footer
Conexión IPv4: 54.90.225.35

Ciencias básicas
  • Compartir

Motor de búsqueda en línea para espectros de Resonancia Magnética Nuclear

Como lo escribe el editorial de Nature [Editorial, 2009], más que nuevos portales web anunciados ruidosamente (Europeana, Geoportail) es necesario la creación de repositorios de datos en formatos únicos que puedan ser integrados fácilmente dentro de sistemas más grandes a futuro.

Categoría RENATA: Acceso a recursos remotos

La creación de estos repositorios libres debe permitir un acceso más democrático a la información y permitir así el desarrollo de herramientas para extraer nuevos conocimentos de la enorme cantidad de información almacenada con el fin de predecir propiedades de compuestos nuevos en el caso que nos interesa.

La primera fase del proyecto (convocatoria Renata anterior) ha permitido automatizar la transferencia de los datos generados por el espectrómetro RMN, usando un formato único y universal (JCAMP-DX, IUPAC), directamente a una base de datos en línea y crear un applet java que permite procesar los datos y visualizar los espectros en línea. El servicio está disponible, para toda la comunidad, en modo de producción en la dirección http://co.mynmrdb.org.

El espectrómetro de la Universidad del Valle ha sido acoplado a la base de datos en abril de este año y se planea conectar el equipo de la Universidad Industrial de Santander tan pronto este instalado. Finalmente se haría la conexión del equipo de la Universidad Nacional durante el transcurso de este año.

De esta manera, todos los espectros generados al nivel nacional serán almacenados en nuestra base de datos (servidor en Bogotá) en un formato único. Para hacer una analogía, es como si cada vez que un usuario saca un fotocopia, en vez de ser impresa, la copia se manda directamente dentro de una base de datos, a la cuenta del usuario. Luego, desde cualquier navegador internet se puede modificar, compartir, borrar e imprimir.

De esta manera se superó el obstáculo más grande para la creación de bases de datos: la buena voluntad de los usuarios, ya que los espectros ingresan a la base de datos independientemente de los usuarios.

Sin embargo, todavía depende del usuario llenar adecuadamente y completar la información correspondiente al espectro de manera que la información sea útil para una tercera persona. En la actualidad es posible que un mismo espectro aparezca bajo distintos nombres o no tenga ningún nombre válido.

Igualmente, es posible que un usuario ya haya estudiado el mismo o un compuesto muy similar y que ya se encuentre el espectro elucidado en la base de datos, por lo que no sería necesario volver a hacer el trabajo.

Finalmente, las industrias farmacéuticas, por ejemplo, usan sistemas completamente automatizados que generan grandes cantidades de datos que requieren de mucha experticia y mucho tiempo humano para analizar y determinar la estructura que corresponde a los espectros. La idea de usar computadores para analizar espectros de manera automática es tan vieja como la RMN, sin embargo, hasta el día de hoy no existen sistemas informáticos completamente automatizados que permiten elucidar la estructura a partir de los espectros RMN como lo haría un experto.

Por estas tres razones es necesario un motor de búsqueda en línea que permita buscar espectros similares dentro de una base de datos accesible por la red desde cualquier laboratorio del mundo. Eso permitiría verificar si ya existe una espectro similar dentro de la base de datos para detectar duplicados que aparezcan con nombre distintos, para encontrar un espectro similar que ya haya sido elucidado de manera a obtener la estructura sin más esfuerzos. Finalmente, a partir de las medidas de similitudes entre espectros del repositorio se podrían desarrollar herramientas de predicción automáticas útiles para resolver problemas de las industrias químicas y farmacéuticas del mundo.

Queremos con su apoyo implementar y desarrollar herramientas (algoritmos) que permiten buscar muy rápidamente espectros similares en bases de datos en línea de gran tamaño y adicionalmente desarrollar e implementar algoritmos para mejorar nuestra capacidad de predecir muy rápidamente desplazamientos químicos.

Queremos resaltar aquí que todos los desarrollos que se proponen a continuación y que pueden parecer abstractos serán implementados dentro del sistema existente (applet y base de datos) accesible para los usuarios de todo el mundo a través de la red. Es importante resaltar que el atractivo de nuestro sistema reposa sobre la idea de una base de datos única en un formato único por lo que es absolutamente necesario desarrollar herramientas de búsqueda para que esta base de datos sea manejable y útil para los usuarios.

Al respecto mencionamos que la dirección técnica de MestreLab, productores y distribuidores del software MestRec Nova (60'000 usuarios en el mundo) se ha comprometido verbalmente (3 Meeting Iberoamericano de RMN, Angra de Reis, Brazil, 4-8 de mayo 2009) a integrar el acceso a nuestra base de datos en su última versión del software, precisamente con el fin de permitir búsquedas por espectros. Finalmente queremos mencionar que nuestra base de datos ya está siendo referenciada en blogs internacionales (http://zusammen.metamolecular.com/2009/03/09/sixty-four-free-chemistry-databases-serialized).

Es de mencionar que los estudiantes vinculados durante la primera fase demostraron que existe en Colombia recursos humanos competitivos para este tipo de proyectos de desarrollos tecnológicos. Varios de ellos ya han recibido ofertas para seguir este tipo de trabajos en programas doctorales de reconocidas instituciones internacionales. Por esta razón, el presupuesto presentado para esta segunda fase está principalmente dirigido a la formación de estudiantes a través de becas y soportes para viajes a congresos donde pueden presentar sus resultados.

Vale la pena aclarar que la prorroga solicitada durante la primera fase no obedece a problema técnicos sino a nuestro compromiso con los estudiantes vinculados para garantizarles un soporte financiero hasta que se gradúen e ir un poco más lejos en los objetivos propuestos.

Esperamos así ayudar a la creación de una comunidad de RMN. La difusión de los resultados obtenidos durante la primera etapa fue pretexto para organizar la "1st Latin American NMR School - Bogotá 2008, a la cual participaron más de 70 estudiantes de posgrado del país. En este ocasión contamos con la participación del premio Nobel Richard Ernst, y 4 reconocidos expertos internacionales. Para el 2010 esperamos poder organizar este evento en la Universidad Industrial de Santander y poder presentar ahí nuestros últimos desarrollos. Para la organización de estos eventos contamos con la participación y soporte de la empresa Bruker (fabricantes de espectrómetros de RMN) que sigue con entusiasmo nuestro esfuerzo.

Nuevamente, la evolución de la segunda fase del proyecto se podrá seguir en la página web del grupo http://www.nmrlab.org y se actualizará la última versión del servicio en http://co.mynmrdb.org

Instituciones participantes:

  • Universidad del Valle

  • Universidad Nacional de Colombia

  • Ecole Polytechnique Federale de Lausanne

  • Universidad Industrial de Santander

Duración (meses): 18
Fecha de Inicio: Enero 2010

Hola mensaje
x
Hello modal box