Spatial interpolation methods offer the ability to obtain the regional spatial distribution of a variable from local measurements, as long as there is a sufficient density of observatories to do so. It should be noted that the interpolation process takes into account the terrain factors that influence the variable within the study region. In this way, representative values are obtained for...
Studying species interactions is crucial for understanding ecosystem dynamics. However, obtaining accurate estimates of biotic interactions requires extensive field sampling over long periods, where more effort leads to more comprehensive estimates. To date, most empirical ecological studies are based on observational data which does not effectively incorporate sampling completeness into...
Las técnicas de selección de variables son esenciales en biomedicina para indentificar variables clave en bases de datos clínicas y para aplicar técnicas con poder clasificatorio y predictivo. En este trabajo se presenta una nueva aproximación basada en submuestreo aleatorio que se puede aplicar en técnicas de selección de variables para conseguir métodos estadísticos robustos. Esta técnica es...
Este trabajo se centra en mejorar las metodologías de diseño mediante la introducción de puntos de apoyo suplementarios, con el objetivo explícito de garantizar un nivel mínimo de KL-eficiencia para una selección óptima entre varias especificaciones de varianza. La metodología se basa en la extensión de la metodología de diseño D-aumentados para el criterio de KL-optimalidad. Además, esta...
La secuenciación masiva de librería de amplicones permite generar en paralelo datos para decenas o miles de loci y gran cantidad de muestras en un mismo experimento. Los sesgos, calidad de secuenciación y la gran cantidad de datos imponen algunos retos en el genotipado de muestras a partir de este tipo de datos genéticos. EasyAmpR es el primer paquete de R diseñado para automatizar el...
La poliploidía es el fenómeno en el que un organismo presenta varias dotaciones completas de cromosomas y puede surgir por distintos procesos, como la duplicación del genoma completo (WGD). Esta duplicación puede afectar significativamente a la expresión génica y las interacciones entre genes, ya que en lugar de duplicar los productos génicos estos tienden a desbalancearse. Las redes de...
Este trabajo de investigación tiene como objetivo analizar el grado de conectividad a través del transporte público de los distintos núcleos poblacionales de la isla de Gran Canaria con diversos polos de atracción social, como por ejemplo las universidades, aeropuertos, parques de atracciones, entre otros. La principal finalidad es estudiar la relación entre las características...
La pandemia de COVID-19 produjo un exceso de defunciones en varias regiones del mundo. En mi charla ilustraré qué necesitamos y cómo podemos estimar este exceso de defunciones con R. En particular, hablaré de todo el flujo de trabajo desde la carga de datos hasta la visualización de los resultados pasando por el análisis de los datos de población y mortalidad utilizando modelos...
One in four people worldwide will experience a mental disorder at some point in their lives, primarily related to anxiety, sleep disorders, or depression. In this work a fuzzy algorithm has been developed in R to determine the emotional and mental state of patients. In particular, we focus on measuring manic symptoms. For this task, a total of 11 fuzzy variables are defined according to the...
In the context of higher education, teaching Science, Technology, Engineering and Mathematics (STEM) disciplines constantly faces the challenge of staying relevant and effective in a world characterized by rapid technological advancements and socioeconomic changes. In particular teaching advanced statistics and data science or machine learning have many challenges due to the complexity of the...
Al igual que durante el siglo pasado la inferencia estadística tuvo que desarrollarse para estimar modelos con los que conseguir extraer la máxima información de una muy corta cantidad de datos, la nueva realidad está caracterizada por disponibilidad de grandes cantidades de datos, y de diferente naturaleza que han dado origen a nuevos modelos y técnicas de análisis (machine learning, Deep...
Cuando se trabaja con proyectos de análisis de datos complejos es usual almacenar numerosos objetos en el workspace de R. Si además de tener numerosos objetos estos son de un tamaño considerable, el manejo de dicho workspace puede volverse engorroso a la vez que ineficiente computacionalmente.
Para mejorar el flujo de trabajo en estas situaciones hemos creado el paquete de R isaves...
Exposure to heat poses a major threat to high-risk populations by substantially contributing to increased morbidity and mortality. Heat-related mortality has been a significant concern since the extreme summer of 2003, when Europe experienced a heatwave, leading to an excess of more than 70,000 deaths during the summer months. In the context of climate change, the 21st-century world is facing...
La evaluación de pesquerías es el proceso por el cual se obtienen una serie de puntos de referencia a partir de la información de las poblaciones de peces y las flotas que los capturan y que nos informan de si dichas poblaciones se encuentran en buenas condiciones para que su explotación sea sostenible. Es decir, nos permite modelar si estamos extrayendo en las capturas lo que la población...
Al optimizar, como su propia definición indica, buscamos la mejor manera de realizar una actividad ahorrando recursos y tiempo. La optimización es un campo de las matemáticas que engloba un gran número de problemas, desde la optimización de horarios, localización de recursos de forma óptima, búsqueda de rutas óptimas que minimicen el tiempo de viaje, etc. Además, la optimización trasciende a...
R packages have a very convenient mechanism for stating their R dependencies, and then resolving them during installation.
This convenience resulted in developers no longer worrying about adding extra dependencies to their packages.
We will briefly look at dependency relationships between R packages, as well as OS dependencies of R packages. We will summarize what is the current state of...
Randomised clinical trials (RCTs) are considered the gold standard for studying the effectiveness of interventions or treatments because randomization ensures similar baseline characteristics and eliminates confounding variables. Observational studies do not use randomization, leading to differences between groups in measured or unmeasured characteristics that could confound the association...
Los datos composicionales se refieren a datos multivariantes representando partes de un total; típicamente expresados en unidades relativas como porcentajes, partes por millón, minutos/día, mg/L, o similares. Su análisis requiere tener en cuenta esta naturaleza relativa, lo que se consigue de forma efectiva y bien fundamentada centrándose en log-cocientes entre las partes. En este contexto,...
En este trabajo se muestra una aplicación de cómo utilizar la información estadística pública del [Instituto Canario de Estadística (ISTAC)][1] y el lenguaje de programación R para aumentar el conocimiento del sector turístico en la isla de Lanzarote.
El resultado es el [Panel de Indicadores de Turismo de Lanzarote][2], una aplicación web desarrollada en R, empleando especialmente la...