6–8 de noviembre de 2024
Sevilla
Europe/Madrid zona horaria

refseqR : operaciones computacionales comunes con registros de la colección RefSeq (NCBI)

No programado
20m
Sevilla

Sevilla

Oral Ciencias naturales

Descripción

La colección de secuencias de referencia del Centro Nacional de Información Biotecnológica (RefSeq, NCBI) mantiene un conjunto de secuencias completo, no redundante y bien anotado, que incluye genomas, transcritos y proteínas. En el momento de escribir estas líneas, el proyecto RefSeq contiene más de 60 millones de transcritos y 320 millones de secuencias de proteínas. En este trabajo describimos refseqR que proporciona un marco práctico para manejar secuencias biológicas alojadas en la colección RefSeq. refseqR simula el flujo de información genética dentro de un sistema biológico, permitiendo procesos direccionales desde loci genéticos recogidos como registros GenBank, a transcritos y de ahí a secuencias de proteínas curadas a partir de la base de datos RefSeq, así como otras combinaciones entre secuencias de estas moléculas. refseqR permite la interoperabilidad y la integración con varios objetos de Bioconductor proporcionando una conexión directa con otros proyectos. El paquete refseqR está implementado en R y se publica bajo la licencia MIT de código abierto.

Afiliación (del autor) Universidad de Córdoba

Autor primario

Jose V. Die (University of Cordoba)

Materiales de la presentación

Todavía no hay materiales.