Google y Broad Institute Colaborar Para datos Genómica

Logotipo de Google

Actualmente Google operan trece centros de datos de puntos alrededor del mundo, con número catorce estar en la etapa de planificación. Estos centros de datos constituyen la infraestructura y el músculo de computación detrás de la plataforma de computación en la nube de Google, que se puede utilizar para almacenar, procesar y gestionar grandes cantidades de datos. Para la comunidad científica, los sistemas de Google trabajan actualmente para almacenar grandes extensiones de datos genómicos y Google Genómica acaba de anunciar una alianza con el Instituto Broad, un centro de investigación biomédica y genómica con sede en Massachusetts. Esta asociación se basa en la mejora de los análisis de ADN para ayudar a curar enfermedades a través de la medicina personalizada basada en nuestra estructura de ADN individual. El proyecto requiere la manipulación de cantidades masivas de datos para establecer cómo diversos tratamientos impacto en un perfil de ADN específica y es aquí donde el sistema de computación en la nube de Google se puede aplicar. Sin embargo, el músculo procesador de aquí de Google se está cumpliendo con el análisis científico del Instituto Broad. Permítanme poner los "grandes cantidades de datos" en perspectiva: la secuenciación de ADN, que es dar sentido a los As, Cs, Gs y Ts de ADN, ya está en las decenas de petabytes y en camino de alcanzar exabytes en el no demasiado Futuro lejano.

El Presidente y Director del Instituto Broad, Eric Lander, dijo esto en la colaboración: "la información genómica a gran escala se está acelerando el progreso científico en el cáncer, la diabetes, los trastornos psiquiátricos y muchas otras enfermedades almacenamiento, análisis y gestión de estos datos se está convirtiendo en una crítica. desafío para los investigadores biomédicos ". Google y Broad Institute trabajarán juntos en nuevas herramientas "para impulsar la investigación biomédica, con amplia experiencia bioinformática, análisis de gran alcance, y la infraestructura de computación masiva." El primer proyecto conjunto implicará llevar Genome Analysis Toolkit del Instituto Broad (o GATK) a la Cloud Platform Google, donde se ofrece como un servicio. El software GATK se ha hecho disponible por algún tiempo y es gratis para los académicos y otras sin fines de lucro usuarios- más de 20.000 usuarios han utilizado GATK para procesar los datos genómicos. La versión basada en la nube Google del servicio inicialmente tienen disponibilidad limitada, pero el objetivo a largo plazo es permitir a la plataforma para cualquier investigador genómico.

Google no es el único desarrollador de plataforma en la nube y hemos visto otros proveedores cortejo universidades y centros académicos con el fin de trabajar juntos. Microsoft anunció recientemente Proyecto Premonition, que utiliza trampas y aviones no tripulados para capturar inteligentes y los mosquitos de transporte para ayudar a prevenir futuros brotes de enfermedades. Parte del Proyecto Premonition es identificar las enfermedades y crear bases de datos basados ​​en la nube de su investigación. En última instancia, los recursos que se vierte en la genómica debería hacer una diferencia en la mejora de la salud humana. Plataforma en la nube de Google proporcionará a la comunidad científica con las herramientas para manipular los datos.





» » Google y Broad Institute Colaborar Para datos Genómica