La biocuración en biodiversidad: proceso, aciertos, errores, soluciones y perspectivas
DOI:
https://doi.org/10.21829/abm108.2014.199Palabras clave:
bases de datos biológicas, biocuración, biodiversidad, CONABIO, e-taxonomíaResumen
La curación de datos biológicos digitales o biocuración es la actividad de organizar, representar y hacer que la información biológica esté accesible para los seres humanos a través de las computadoras. Entre sus tareas están la organización, estandarización, normalización, clasificación, anotación y análisis de la información. El Sistema Nacional de Información sobre Biodiversidad (SNIB) de la Comisión Nacional para el Conocimiento y Uso de la Biodiversidad (CONABIO) integra la información referente a cerca de seis millones de registros de ejemplares y observaciones biológicas provenientes principalmente de las colecciones zoológicas y herbarios de México. Para administrar esa información la CONABIO ha establecido mecanismos de control de calidad de los datos que ingresan al SNIB que permiten integrar la información proveniente de diferentes fuentes y hacerla consistente e interoperable con otros sistemas de información. Se expone la importancia de la biocuración de bases de datos de biodiversidad, se explica el proceso de curación llevado a cabo en el sistema Biótica© de CONABIO, se dan algunos ejemplos de los errores más comunes que se presentan en los datos biológicos como: omisión, tipográficos, contextuales, redundancia, convención, uniformidad y congruencia; se presentan algunas soluciones, y se discute sobre la importancia de la investigación y enseñanza de la biocuración para los biólogos del siglo XXI.
Descargas
Citas
Abbott, D. 2009. Interoperability. DCC Briefing Papers: introduction to curation. Digital Curation Centre. Edinburgh, UK. Consultado el 31 de marzo de 2014. http://hdl.handle.net/1842/3363
Ball, A. y M. Duke. 2012. How to cite datasets and link to publications. DCC How-to Guides. Edinburg: Digital Curation Centre. http://www.dcc.ac.uk/resources/how-guides/cite-datasets#x1-17000
Bisby, F. A. 2000. The quiet revolution: biodiversity informatics and the internet. Science 289(5488): 2309-2312. DOI: https://doi.org/10.1126/science.289.5488.2309
Bourne, P. E. y J. McEntyre. 2006. Biocurators: contributors to the world of science. PLoS Comp. Biol. 2(10): e142. doi:10.1371/journal.pcbi.0020142 DOI: https://doi.org/10.1371/journal.pcbi.0020142
Burge, S., T. K. Attwood, A. Bateman, T. Z. Berardini, M. Cherry, C. O’Donovan, C. L. Xenarios y P. Gaudet. 2012. Biocurators and biocuration: surveying the 21st century challenges. Database: The Journal of Biological Databases and Curation. Database (Oxford). 2012: bar059. doi: 10.1093/database/bar059. Consultado el 31 de marzo de 2014. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3308150/ DOI: https://doi.org/10.1093/database/bar059
CONABIO. 2002. El Sistema Nacional de Información sobre Biodiversidad. CONABIO. Biodiversitas 44: 3-13.
CONABIO. 2006. Procedimiento para el control de calidad en las bases de datos taxonómicas-biogeográficas que se integran al SNIB. Ver. 1.4. Documento interno, México, D.F., México. 14 pp.
CONABIO. 2008. Sistema de información Biótica©. Versión 5.0. Manual de usuario. México, D.F., México. 977 pp.
CONABIO. 2010. Instructivo para la conformación de bases de datos taxonómico-biogeográficas compatibles con el Sistema Nacional de Información sobre Biodiversidad. México, D.F. México. Consultado el 31 de marzo de 2014. http://www.conabio.gob.mx/web/proyectos/pdf/instructivos/instructivo_bd_2010.pdf
CONABIO. 2012. Sitio oficial de la Comisión Nacional para el Conocimiento y Uso de la Biodiversidad. http://www.conabio.gob.mx
Davis, A. P., T. C. Wiegers, M. C. Rosenstein, C. G. Murphy y C. J. Mattingly. 2011. The curation paradigm and application tool used for manual curation of the scientific literature at the Comparative Toxicogenomics Database. Database: The Journal of Biological Databases and Curation 2011(0): bar034. doi:10.1093/database/bar034. Consultado el 31 de marzo de 2014. http://database.oxfordjournals.org/content/2011/bar034.full.pdf+html DOI: https://doi.org/10.1093/database/bar034
EMBL-European Bioinformatics Institute. 2013. ELIXIR European Life Sciences Infraestructure for Biological Information ©. http://www.elixir-europe.org
Goble, C., R. Stevens, D. Hull, K. Wolstencroft y R. Lopez. 2008. Data curation + process curation=data integration + science. Briefings in Bioinformatics 9(6): 506-517. Consultado el 31 de marzo de 2014. http://bib.oxfordjournals.org/content/9/6/506.full DOI: https://doi.org/10.1093/bib/bbn034
Heidorn, P. B. 2003. Biological informatics: a comparison of biodiversity informatics and neuroinformatics. Bull. Am. Soc. Info. Sci. Tech. 30(1): 12-13. doi: 10.1002/bult.298. Consultado el 31 de marzo de 2014. http://www.asis.org/Bulletin/Oct-03/heidorn.html. DOI: https://doi.org/10.1002/bult.298
Heidorn, P. B., C. L. Palmer, M. H. Cragin, y L. C. Smith. 2007. Data curation education and biological information specialists. DigCCurr2007: An International Symposium in Digital Curation. Paper and Presentation, Chapel Hill, North Carolina, April 18-20. 2007. North Carolina, USA. Consultado el 4 de abril de 2014. https://www.ideals.illinois.edu/handle/2142/2442
Higgins, S. 2008a. The DCC Curation Lifecycle Model. Proceeding of the 8th ACM/IEEE Joint Conference on Digital Libraries. Pittsburgh, USA. p. 453. doi:10.1145/1378889.1378998 DOI: https://doi.org/10.1145/1378889.1378998
Higgins, S. 2008b. The DCC Curation Lifecycle Model. The International Journal of Digital Curation 3(1): 134-140. doi:10.2218/ijdc.v3i1.48. Consultado el 4 de abril de 2014. http://www.ijdc.net/index.php/ijdc/article/view/69/48 DOI: https://doi.org/10.2218/ijdc.v3i1.48
Higgins, S. 2009. The DCC Curation Lifecycle Model, TCDL Bulletin of IEEE Technical Committee on Digital Libraries 5(1): n.d. Recuperado Febrero 22, 2013. doi:10.2218/ijdc.v6i2.191. http://www.ieee-tcdl.org/Bulletin/v5n1/Higgins/higgins.html
Higgins, S. 2011. Digital curation: The emergence of a new discipline. The International Journal of Digital Curation 6(2): 78-88. doi:10.2218/ijdc.v6i2.191. Consultado el 4 de abril de 2014. http://www.ijdc.net/index.php/ijdc/article/view/184 DOI: https://doi.org/10.2218/ijdc.v6i2.191
Hirschman, L., G. A. P. Burns, M. Krallinger y C. Arighi. 2012. Text mining for the biocuration workflow. Database: The Journal of Biological Databases and Curation. Database (Oxford). 2012(0): bas020 doi:10.1093/database/bas020. Published online April 18, 2012. http://database.oxfordjournals.org/content/2012/bas020.full DOI: https://doi.org/10.1093/database/bas020
Howe, D., M. Costanzo, P. Fey, T. Gojobori, L. Hannick, W. Hide, D. P. Hill, R. Kania, M. L., Schaeffer, S. St. Pierre, S. Twigger, O. White y S. Y. Rhee. 2008. Big data: the future of biocuration. Nature 455(7209): 47-50. doi: 10.1038/455047a. Published online 3 September 2008. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2819144/ DOI: https://doi.org/10.1038/455047a
Landsman, D., R. Gentleman, J. Kelso y B. F. Francis Ouellette. 2009. DATABASE: a new forum for biological databases and curation. Database (Oxford). 2009(0), bap002–bap002. Published online Mar 16, 2009. doi:10.1093/database/bap002. http://database.oxfordjournals.org/content/2009/bap002.full DOI: https://doi.org/10.1093/database/bap002
Miotto, O., T. W.W. Tan y V. Brusic. 2005. Supporting the curation of biological databases with reusable text mining. Genome informatics 16(2): 32-44. Consultado el 9 de abril de 2014. http://www.jsbi.org/pdfs/journal1/GIW05/GIW05F011.pdf
Salimi, N. y R. Vita. 2006. The biocurator: connecting and enhancing scientific data. PLoS Comp. Biol. 2(10): e1 25. Published online Oct 27, 2006. doi: 10.1371/journal.pcbi.0020125. http://www.ploscompbiol.org/article/info%3Adoi%2F10.1371%2Fjour nal.pcbi.0020125
Sanderson, K. 2011. BIOINFORMATICS: curation generation. Nature 470: 295-296. DOI: https://doi.org/10.1038/nj7333-295a
Sarukhán, J. 1992. La coordinación de acciones en torno a la biodiversidad en México: una propuesta de prioridad nacional. In: Sarukhán, J. y R. Dirzo (eds.). México ante los retos de la biodiversidad. Comisión Nacional para el Conocimiento y Uso de la Biodiversidad (CONABIO). México, D.F., México. pp. 291-299.
Schadt, E., M. D. Linderman, J. Sorenson, J. Lee y G. P. Nolan. 2010. Computational solutions to large-scale data management and analysis. Nat. Rev. Genet. 11(9): 647-657. DOI: https://doi.org/10.1038/nrg2857
Shimoyama, M., G. T. Hayman, S. J. F. Laulederkind, R. Nigam, T. F. Lowry, V. Petri, y H. J. Jacob. 2009. The rat genome database curators: who, what, where, why. PLoS Comp. Biol. 5(11): e1000582. doi:10.1371/journal.pcbi.1000582. DOI: https://doi.org/10.1371/journal.pcbi.1000582
Thornton, J. 2009. Data curation in biology – past, present and future. Nature Precedings. doi:10.1038/npre.2009.3225.1.http://precedings.nature.com/documents/3225/version/1 DOI: https://doi.org/10.1038/npre.2009.3225.1
Trelles, O., P. Prins, M. Snir y Jansen, R.C. 2011. Big data, but are we ready? Nat. Rev. Genet. 12(3): 224. DOI: https://doi.org/10.1038/nrg2857-c1
Publicado
Cómo citar
-
Resumen737
-
PDF323
-
HTML376
Número
Sección
Licencia
Derechos de autor 2015 Acta Botanica Mexicana
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
De acuerdo con la legislación de derechos de autor, Acta Botanica Mexicana reconoce y respeta el derecho moral de los autores, así como la titularidad del derecho patrimonial, el cual será cedido a la revista para su difusión en acceso abierto. Acta Botanica Mexicana no realiza cargos a los autores por enviar y procesar artículos para su publicación.
Todos los textos publicados por Acta Botanica Mexicana –sin excepción– se distribuyen amparados bajo la licencia Creative Commons 4.0 Atribución-No Comercial (CC BY-NC 4.0 Internacional), que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en Acta Botanica Mexicana (por ejemplo incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en Acta Botanica Mexicana.
Para todo lo anterior, el corrector de originales le solicitará junto con la revisión de galeras, que expida su Carta-Cesión de la Propiedad de los Derechos de la primera publicación debidamente requisitado y firmado por el autor(es). Esta carta se debe enviar por correo electrónico en archivo pdf al correo: acta.botanica@inecol.mx (Carta-Cesión de Propiedad de Derechos de Autor).