La secuenciación de 'Escherichia coli' demuestra "la importancia de la investigación rápida y colaborativa por internet"
José Pichel Andrés/DICYT Dentro del curso Bioinformatics and network biology, que tiene lugar esta semana en el Centro de Investigación del Cáncer (CIC) de Salamanca, ha intervenido hoy Eduardo Pareja Tallo, científico de Era7 Information Technologies, una empresa de Granada que ha participado en el análisis de los datos de la secuenciación del genoma de la nueva cepa de la bacteria Escherichia coli, detectada recientemente en Alemania. En su opinión, la secuenciación y análisis de este genoma bacteriano en un tiempo récord ha sido posible gracias a una nueva filosofía de colaboración científica basada en internet y en el software libre.
"Estamos trabajando desde hace años en la anotación de genomas bacterianos como una de nuestras principales líneas de investigación", ha explicado Eduardo Pareja en declaraciones a DiCYT. En la actualidad, la secuenciación de un genoma se puede realizar en pocos días gracias a las nuevas tecnologías de secuenciación masiva. "Primero, se obtienen muchos trocitos de la secuencia; el siguiente paso es ensamblarlos con programas de ordenador, es decir, montar el puzle para obtener toda la secuencia; pero aun así lo que obtenemos es una simple lista de letras", explica. Para que finalmente esta información cobre sentido se procede a la anotación, que consiste en "usar estrategias, software y procedimientos para colocar sobre esa lista de letras dónde están los genes e identificar su funciones", señala.
Para realizar esta anotación hay diversos métodos. "Las técnicas de secuenciación han cambiado mucho y nosotros hemos desarrollado un método especialmente adaptado a estas nuevas tecnologías de secuenciación con resultados de bastante calidad", comenta. El software con el que trabaja Era7 Information Technologies es de fuente abierta, de manera que cualquiera puede descargarse este sistema de anotación del genoma bacteriano y trabajar con él.
Precisamente, el uso de las nuevas tecnologías e internet posibilitó que la empresa granadina pudiera sumarse hace pocos días a la tarea de analizar la nueva cepa de la bacteria E. coli, que ha causado varias muertes en Alemania.
"Estábamos presentando en Cambridge nuestro sistema de anotación funcional de genoma bacteriano cuando el Beijing Genomics Institute consiguió la primera versión de la secuencia del genoma y la puso a disposición de la comunidad. Esto nos dio la oportunidad a todos de coger los datos y empezar a trabajar con ellos", afirma. Curiosamente, "nos enteramos por Twitter de que estaban disponibles los datos y probablemente fuimos los primeros del mundo que hicimos una anotación de ese genoma", asegura Eduardo Pareja.
"Además de tener la suerte de contar con un sistema muy bueno para analizar el genoma bacteriano, lo que nos permitió hacerlo rápido y con bastante calidad, hemos ayudado a organizar todo ese conocimiento en un repositorio, una experiencia muy interesante trabajando con datos muy buenos y el análisis de esa información", comentó.
En 20 días, los científicos han logrado avances extraordinarios en torno a la nueva cepa de E. coli, porque "hay siete u ocho secuencias de genoma diferentes, diferentes ensamblajes, muchas anotaciones, conclusiones sobre resistencia a antibióticos, plásmidos, toxinas... Con modelos más antiguos de publicación esto sería mucho más largo, así que esto nos enseña la importancia de la colaboración científica rápida a través de internet", afirma el experto.
Sin embargo, esto no quiere decir que haya que cambiar el sistema tradicional de publicaciones científicas, basadas sobre todo en la revisión de expertos, señala, pero sí "añadirle ciertos elementos que permiten compartir datos muy rápido", comenta. Así, los científicos podrían ofrecer sus datos y sus análisis de manera gratuita y libre en un "modelo de negocio nuevo que tiene éxito y que no está basado en ocultar información".
A pesar de que esta manera de trabajar sólo ha aflorado en casos urgentes como la epidemia de gripe A o la bacteria E. coli, Eduardo Pareja aboga por generalizar el sistema ya que toda investigación puede ser importante.
Nuevo equipamiento en Salamanca
La base de todos estos trabajos está en las nuevas tecnologías de secuenciación masiva, a las que se ha incorporado la Universidad de Salamanca con la adquisición por parte de la Plataforma de Apoyo a la Investigación Nucleus de un nuevo equipamiento presentado ayer mismo: Genome Sequencer FLX 454 Life Sciences de Roche Diagnostics S. L. En este sentido, Eduardo Pareja ha asegurado que "es muy importante que se difundan las nuevas tecnologías de secuenciación, porque tienen un impacto enorme en investigación y en la industria biotecnológica, agricultura, ganadería y medicina".
Además, ha destacado que gracias a estos avances tecnológicos se ha abaratado la secuenciación. "A finales de 2007 secuenciar 1.000.000 de nucleótidos costaba 400 dólares y ahora 30 céntimos de dolar. Por lo tanto, ahora se puede tener un genoma bacteriano secuenciado y anotado en menos de una semana y por menos de 5.000 euros. Esto no se podía ni soñar hace cuatro años y tiene enormes aplicaciones", asegura.