Ponente
Descripción
Las técnicas de selección de variables son esenciales en biomedicina para indentificar variables clave en bases de datos clínicas y para aplicar técnicas con poder clasificatorio y predictivo. En este trabajo se presenta una nueva aproximación basada en submuestreo aleatorio que se puede aplicar en técnicas de selección de variables para conseguir métodos estadísticos robustos. Esta técnica es apropiada en proyectos con un gran número de muestras y tiene una aplicación directa en proyectos de expresión de célula única. Como ejemplo mostraremos los resultados obtenidos en un problema de predicción de la edad mediante el análisis de datos de expresión de ARN.
Para su aplicación hemos desarrollado en paquete GeneCoexp, que además de realizar una selección de características con técnicas de coexpresión, permite identificar relaciones de coexpresión robusta entre genes y diferenciarlas de las producidas por una posible estratificación de las muestras. Para su ejecución es necesario realizar un gran número de submuestreos, por lo que ha sido necesario reimplementar las funciones de coexpresión y usar paralelización para conseguir resultados en tiempo real. Como resultado el paquete permite generar una red de coexpresión robusta que se puede explorar interactivamente con el paquete rD3plot.
Financiación
A.C. ha sido financiada por el "Programa investigo" en el marco del Plan de Recuperación, Transformación y Resiliencia (SEPE, JCyL, Fondos NextGenerationEU financiados por la Union Europea). A.S. recibió inanciación del Programa Operativo de Empleo Juvenil, Fondo social Europeo (FSE), Junta de Castilla y Leon (JCyL). D.B. ha sido financiado por el programa PTA (PTA2022-022270-I) del Ministerio de Ciencia, Innovación y Universidades.
Afiliación (del autor) | Universidad de Salamanca |
---|---|
¿Presentas la comunicación a premio? | Premio estudiante (grado, máster, doctoral) |