GenBank

GenBank es una base de datos de acceso abierto, establecida en 1982, que informa de todas las secuencias de nucleótidos y proteínas relacionadas obtenidas después de su traducción. La base de datos es producida y mantenida por el National Center for Biotechnology Information (NCBI), que forma parte de los National Institutes of Health, Estados Unidos, dentro de la International Nucleotide Sequence Database Collaboration (INSDC). GenBank recibe su propia información de los resultados obtenidos en más de 300. 000 organismos distintos de laboratorios repartidos por todo el mundo, que representan el punto de Referencia más importante en su campo de investigación. Versión 236. 0, fechado el 15 de febrero de 2020, contiene más de 216 millones de loci y más de 399 mil millones de bases de más de 216 millones de secuencias reportadas.

La idea de crear una base de datos de secuencias de nucleótidos nació en 1979 teniendo entre sus principales promotores a Walter Goad, investigador del grupo de Biología teórica y Biofísica del Laboratorio Nacional de Los Álamos. Tres años más tarde, se estableció GenBank, con fondos de los Institutos Nacionales de Salud y otras agencias federales. El Laboratorio Nacional de Los Álamos comenzó a colaborar con la empresa Bolt, Beranek y Newman y en un año GenBank recolectó más de 2. 000 secuencias. A mediados de la década de 1980, la IntelliGenetics bioinformatics company de la Universidad de Stanford gestionó el proyecto GenBank, de nuevo en colaboración con el Laboratorio Nacional de Los Álamos. Una de las primeras comunidades de bioinformática en Internet, GenBank comenzó a promover las comunicaciones científicas de acceso abierto. Entre 1989 y 1992 el proyecto fue transferido al nuevo Centro Nacional de Información Biotecnológica.

Solo las secuencias originales pueden ser enviadas a GenBank. Los datos directos se pueden enviar en línea a través de BankIt o fuera de línea utilizando el software Sequin. Al recibir la secuencia, el personal examina la originalidad de los datos y le asigna un número de acceso que garantiza el control de calidad. Finalmente, los datos se introducen en la base de datos y se hacen públicos, llegando a ser accesibles a través de Entrez o descargables a través de FTP. Las presentaciones masivas de etiquetas de secuencia expresada (EST), sitio de secuencia etiquetada (STS), secuencia de estudio del genoma (GSS) y secuencia del genoma de alto rendimiento (HTGS) son más a menudo el trabajo de los centros de secuenciación a gran escala. GenBank también gestiona y procesa secuencias genómicas microbianas completas.

Bases de datos de bioinformática

MedRxiv

Medrxiv es un sitio web que distribuye publicaciones inéditas sobre Ciencias de la salud. Distribuye gratuitamente al lector manuscritos completos pero aún no p...

Swiss-Prot

Swiss-Prot es una base de datos biológica que contiene secuencias de proteínas. Swiss-Prot fue creado en 1986 por Amos Bairoch durante su doctorado y desarrolla...

Archivos de acceso abierto

Base

Bioinformática

Esta página se basa en el artículo de Wikipedia: Fuente, Autores, Licencia Creative Commons Reconocimiento-CompartirIgual.
This page is based on the Wikipedia article: Source, Authors, Creative Commons Attribution-ShareAlike License.
contactos
Política de privacidad , Descargos de responsabilidad