class: center, middle # ¿Por qué R? ### Análisis estadístico utilizando R UNQ UNTreF CONICET Ignacio Spiousas [<svg viewBox="0 0 496 512" style="height:1em;position:relative;display:inline-block;top:.1em;fill:#A42339;" xmlns="http://www.w3.org/2000/svg"> <path d="M165.9 397.4c0 2-2.3 3.6-5.2 3.6-3.3.3-5.6-1.3-5.6-3.6 0-2 2.3-3.6 5.2-3.6 3-.3 5.6 1.3 5.6 3.6zm-31.1-4.5c-.7 2 1.3 4.3 4.3 4.9 2.6 1 5.6 0 6.2-2s-1.3-4.3-4.3-5.2c-2.6-.7-5.5.3-6.2 2.3zm44.2-1.7c-2.9.7-4.9 2.6-4.6 4.9.3 2 2.9 3.3 5.9 2.6 2.9-.7 4.9-2.6 4.6-4.6-.3-1.9-3-3.2-5.9-2.9zM244.8 8C106.1 8 0 113.3 0 252c0 110.9 69.8 205.8 169.5 239.2 12.8 2.3 17.3-5.6 17.3-12.1 0-6.2-.3-40.4-.3-61.4 0 0-70 15-84.7-29.8 0 0-11.4-29.1-27.8-36.6 0 0-22.9-15.7 1.6-15.4 0 0 24.9 2 38.6 25.8 21.9 38.6 58.6 27.5 72.9 20.9 2.3-16 8.8-27.1 16-33.7-55.9-6.2-112.3-14.3-112.3-110.5 0-27.5 7.6-41.3 23.6-58.9-2.6-6.5-11.1-33.3 2.6-67.9 20.9-6.5 69 27 69 27 20-5.6 41.5-8.5 62.8-8.5s42.8 2.9 62.8 8.5c0 0 48.1-33.6 69-27 13.7 34.7 5.2 61.4 2.6 67.9 16 17.7 25.8 31.5 25.8 58.9 0 96.5-58.9 104.2-114.8 110.5 9.2 7.9 17 22.9 17 46.4 0 33.7-.3 75.4-.3 83.6 0 6.5 4.6 14.4 17.3 12.1C428.2 457.8 496 362.9 496 252 496 113.3 383.5 8 244.8 8zM97.2 352.9c-1.3 1-1 3.3.7 5.2 1.6 1.6 3.9 2.3 5.2 1 1.3-1 1-3.3-.7-5.2-1.6-1.6-3.9-2.3-5.2-1zm-10.8-8.1c-.7 1.3.3 2.9 2.3 3.9 1.6 1 3.6.7 4.3-.7.7-1.3-.3-2.9-2.3-3.9-2-.6-3.6-.3-4.3.7zm32.4 35.6c-1.6 1.3-1 4.3 1.3 6.2 2.3 2.3 5.2 2.6 6.5 1 1.3-1.3.7-4.3-1.3-6.2-2.2-2.3-5.2-2.6-6.5-1zm-11.4-14.7c-1.6 1-1.6 3.6 0 5.9 1.6 2.3 4.3 3.3 5.6 2.3 1.6-1.3 1.6-3.9 0-6.2-1.4-2.3-4-3.3-5.6-2z"></path></svg>](https://github.com/spiousas) [<svg viewBox="0 0 512 512" style="height:1em;position:relative;display:inline-block;top:.1em;fill:#A42339;" xmlns="http://www.w3.org/2000/svg"> <path d="M459.37 151.716c.325 4.548.325 9.097.325 13.645 0 138.72-105.583 298.558-298.558 298.558-59.452 0-114.68-17.219-161.137-47.106 8.447.974 16.568 1.299 25.34 1.299 49.055 0 94.213-16.568 130.274-44.832-46.132-.975-84.792-31.188-98.112-72.772 6.498.974 12.995 1.624 19.818 1.624 9.421 0 18.843-1.3 27.614-3.573-48.081-9.747-84.143-51.98-84.143-102.985v-1.299c13.969 7.797 30.214 12.67 47.431 13.319-28.264-18.843-46.781-51.005-46.781-87.391 0-19.492 5.197-37.36 14.294-52.954 51.655 63.675 129.3 105.258 216.365 109.807-1.624-7.797-2.599-15.918-2.599-24.04 0-57.828 46.782-104.934 104.934-104.934 30.213 0 57.502 12.67 76.67 33.137 23.715-4.548 46.456-13.32 66.599-25.34-7.798 24.366-24.366 44.833-46.132 57.827 21.117-2.273 41.584-8.122 60.426-16.243-14.292 20.791-32.161 39.308-52.628 54.253z"></path></svg>](https://twitter.com/Spiousas) Pablo Etchemendy [<svg viewBox="0 0 496 512" style="height:1em;position:relative;display:inline-block;top:.1em;fill:black;" xmlns="http://www.w3.org/2000/svg"> <path d="M165.9 397.4c0 2-2.3 3.6-5.2 3.6-3.3.3-5.6-1.3-5.6-3.6 0-2 2.3-3.6 5.2-3.6 3-.3 5.6 1.3 5.6 3.6zm-31.1-4.5c-.7 2 1.3 4.3 4.3 4.9 2.6 1 5.6 0 6.2-2s-1.3-4.3-4.3-5.2c-2.6-.7-5.5.3-6.2 2.3zm44.2-1.7c-2.9.7-4.9 2.6-4.6 4.9.3 2 2.9 3.3 5.9 2.6 2.9-.7 4.9-2.6 4.6-4.6-.3-1.9-3-3.2-5.9-2.9zM244.8 8C106.1 8 0 113.3 0 252c0 110.9 69.8 205.8 169.5 239.2 12.8 2.3 17.3-5.6 17.3-12.1 0-6.2-.3-40.4-.3-61.4 0 0-70 15-84.7-29.8 0 0-11.4-29.1-27.8-36.6 0 0-22.9-15.7 1.6-15.4 0 0 24.9 2 38.6 25.8 21.9 38.6 58.6 27.5 72.9 20.9 2.3-16 8.8-27.1 16-33.7-55.9-6.2-112.3-14.3-112.3-110.5 0-27.5 7.6-41.3 23.6-58.9-2.6-6.5-11.1-33.3 2.6-67.9 20.9-6.5 69 27 69 27 20-5.6 41.5-8.5 62.8-8.5s42.8 2.9 62.8 8.5c0 0 48.1-33.6 69-27 13.7 34.7 5.2 61.4 2.6 67.9 16 17.7 25.8 31.5 25.8 58.9 0 96.5-58.9 104.2-114.8 110.5 9.2 7.9 17 22.9 17 46.4 0 33.7-.3 75.4-.3 83.6 0 6.5 4.6 14.4 17.3 12.1C428.2 457.8 496 362.9 496 252 496 113.3 383.5 8 244.8 8zM97.2 352.9c-1.3 1-1 3.3.7 5.2 1.6 1.6 3.9 2.3 5.2 1 1.3-1 1-3.3-.7-5.2-1.6-1.6-3.9-2.3-5.2-1zm-10.8-8.1c-.7 1.3.3 2.9 2.3 3.9 1.6 1 3.6.7 4.3-.7.7-1.3-.3-2.9-2.3-3.9-2-.6-3.6-.3-4.3.7zm32.4 35.6c-1.6 1.3-1 4.3 1.3 6.2 2.3 2.3 5.2 2.6 6.5 1 1.3-1.3.7-4.3-1.3-6.2-2.2-2.3-5.2-2.6-6.5-1zm-11.4-14.7c-1.6 1-1.6 3.6 0 5.9 1.6 2.3 4.3 3.3 5.6 2.3 1.6-1.3 1.6-3.9 0-6.2-1.4-2.3-4-3.3-5.6-2z"></path></svg>](https://github.com/https://github.com/petcheme) [<svg viewBox="0 0 512 512" style="height:1em;position:relative;display:inline-block;top:.1em;fill:#black;" xmlns="http://www.w3.org/2000/svg"> <path d="M459.37 151.716c.325 4.548.325 9.097.325 13.645 0 138.72-105.583 298.558-298.558 298.558-59.452 0-114.68-17.219-161.137-47.106 8.447.974 16.568 1.299 25.34 1.299 49.055 0 94.213-16.568 130.274-44.832-46.132-.975-84.792-31.188-98.112-72.772 6.498.974 12.995 1.624 19.818 1.624 9.421 0 18.843-1.3 27.614-3.573-48.081-9.747-84.143-51.98-84.143-102.985v-1.299c13.969 7.797 30.214 12.67 47.431 13.319-28.264-18.843-46.781-51.005-46.781-87.391 0-19.492 5.197-37.36 14.294-52.954 51.655 63.675 129.3 105.258 216.365 109.807-1.624-7.797-2.599-15.918-2.599-24.04 0-57.828 46.782-104.934 104.934-104.934 30.213 0 57.502 12.67 76.67 33.137 23.715-4.548 46.456-13.32 66.599-25.34-7.798 24.366-24.366 44.833-46.132 57.827 21.117-2.273 41.584-8.122 60.426-16.243-14.292 20.791-32.161 39.308-52.628 54.253z"></path></svg>](https://twitter.com/petcheme) 2022-06-27 --- class: center, middle, inverse Como un anticipo del curso, les cuento que esta presentación ha sido preparada enteramente en **R** 🎉 usando los paquetes **Rmarkdown**📦 y **Xaringan**📦 <img src="https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/rmarkdown.png" width="10%" /><img src="https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/xaringan.png" width="10%" /> --- class: left, top, highlight-last-item # Gratis y Open-source El hecho de que **R** sea gratis es especialmente beneficioso para estudiantes e investigadores en países en desarrollo Además, **R** es muy utilizado tanto en la academia como en la industria y su popularidad ha crecido en los años recientes .pull-left.center[ ![:scale 75%](https://149351115.v2.pressablecdn.com/wp-content/uploads/2017/10/plot_tags_time-1-768x768.png) .caption[*fuente:* Robinson(2017)] ] .pull-right.center[ ![:scale 75%](https://149351115.v2.pressablecdn.com/wp-content/uploads/2017/10/by_industry_graph-1-768x768.png) .caption[*fuente:* Robinson(2017)] ] --- class: left, top, highlight-last-item # La comunidad Una de las principales razones para comenzar y continuar usando **R** es su comunidad. Una comunidad diversa en términos de expertise, identidad, ubicación, afiliaciones y experiencia. Hay una gan cantidad de recursos gratuitos incluidos **tutoriales** y **libros** <br> <br> .center[ ![:scale 17%](https://d33wubrfki0l68.cloudfront.net/b88ef926a004b0fce72b2526b0b5c4413666a4cb/24a30/cover.png)´ ![:scale 17%](https://images.routledge.com/common/jackets/crclarge/978081538/9780815384571.jpg) ![:scale 17%](https://bookdown.org/yihui/rmarkdown/images/cover.png) ] ??? Como tal, muchos en la comunidad R están motivados por la colaboración y la interdependencia entre investigadores. --- class: left, top, highlight-last-item # La comunidad Existen grupos con actividades increíbles y una infinidad de actividades y recursos (por ejemplo, en **YouTube**) - **RenBaires** https://renbaires.github.io/ ![:scale 5%](https://renbaires.github.io/assets/icons/icon.png) - Hay muchos grupos de **RLadies** increíbles! - **RLadies Buenos Aires** https://twitter.com/rladiesba - **RLadies Oslo** https://twitter.com/rladiesoslo - **RLadies Seattle** https://rladiesseattle.org/ También es una buena idea seguir los hashtags **#rstats** y **#tidytuesday** en Twitter --- class: left, top, highlight-last-item # El uso de R en las ciencias **R** es cada día un recurso más ubicuo en las publicaciones académicas Muchos de los métodos estadísticos "de moda" tienen implementaciones en **R** .center[ ![:scale 40%](https://wrathematics.github.io/assets/marketshare.png) .caption[ [Fuente](https://librestats.com/2012/04/12/statistical-software-popularity-on-google-scholar/) ]] --- class: left, top, highlight-last-item # Adaptable y flexible ###Adaptabilidad Los usuarios de **R** pueden escribir paquetes que aumenten las capacidades de **R** Existen miles de **paquetes** disponibles online para agregarle funcionalidades al **R Base** ###Flexibilidad **R** nos permite configurar los parámetros de la gran mayoría de los métodos y funciones de una manera mucho más directa que los sofware propietarios ??? La adaptabilidad de **R** significa que los métodos estadísticao más modernos están disponibles en R años antes que en los softwares propietarios. Suponga que desea realizar un procedimiento estadístico pero modificarlo ligeramente. En un lenguaje propietario, esto suele ser difícil: el código utilizado para ejecutar el procedimiento se mantiene oculto y los únicos parámetros que puede cambiar son los que se incluyen como opciones y se muestran al usuario. En R, es mucho más fácil realizar cambios. --- class: left, top, highlight-last-item # Los paquetes de R 📦 Existe una infinidad de paquetes para ayudarnos a trabajar en **R** Para instalarlos debemos ejecutar: ```r install.packages("paquete_ejemplo") ``` Una vez instalado se lo debe cargar a la sesión con: ```r library(paquete_ejemplo) ``` .center[ <img src="https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/tidyverse.png" width="15%" /> <img src="https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/readr.png" width="8%" /><img src="https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/tidyr.png" width="8%" /><img src="https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/tibble.png" width="8%" /><img src="https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/pipe.png" width="8%" /><img src="https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/dplyr.png" width="8%" /> ] ??? A veces para instalar paquetes, sobre todo cuando son nuevos, hay que seguir los pasos del desarrollador. Les recomiendo buscar la página de Github de los paquetes. Durante el curso vamos a utilizar principalmente los paquetes del **Tidyverse** y los utilizados para el ajuste de **modelos lineales de efectos mixtos** --- class: left, top, highlight-last-item # Un paso hacia la ciencia abierta ### Replicabilidad Es posible generar scripts de análisis o documentos utilizando **Rmarkdown** ### Reproductibilidad Otra razón importante para considerar **R** es que hay muchas herramientas gratuitas diseñadas para incrementar la **reproductibilidad** en ciencia Por ejemplo, utilizando plataformas como **Open Science Framework** todo el pipeline de análisis puede ser abierto y transparente Por ejemplo, se puede adjuntar a un trabajo un noteboook de **Rmarkdown** o una **Shiny app** para que la comunidad pueda utilizar nuestros datos y repetir nuestros análisis ### Control de cambios **R** ofrece la posibilidad de utilizar sistemas de control de cambios tipo **git** para trabajar colaborativamente y de forma organizada. ??? Las ventajas de **R** sobre un software en el que tenemos que cargar los datos y clickear es que es muy sencillo repetir los análisis, ya sea con distintos dataset o con pequeños cambios (por ejemplo, cambiando algún parámetro) Existen también paquetes como papaja que permiten escribir artículos directamenten en RMarkdown --- class: left, top, highlight-last-item # El lenguaje R El lenguaje **R** ha mejorado tanto en mejoras en el **R** base como en mediante el desarrollo de **paquetes** Con unas líneas de código podemos **importar** los datos, **crear** una variable y **calcular** las medias por grupo. ```r library(dplyr) data <- read_csv("mi_experimento.csv") # Leer los datos data <- mutate(data, nueva_var = var + 2) # Crear una nueva variable data <- data %>% group_by(grupejo) %>% summarise(media = mean(new_var) # Obtener la media por grupo ``` Esto nos permite **probar** cosas y **equivocarnos** sin necesidad de modificar los datos originales Esto se contrapone a los softwares **point and click** en los cuales hay que tener una versión del archivo de datos para cada paso --- class: left, top, highlight-last-item # Los beneficios de no clickear .center[ ![:scale 55%](./figs/golem.png) .caption[*Fuente:* McElreath, 2018] <br> <br> **Pensar los modelos y analizar los resultados** ] --- class: left, top, highlight-last-item # Cómo olvidar gráficas tan lindas 🗻 Aunque no lo crean, estas infografías están hechas 100% utilizando **R** .center.mid[ ![:scale 60%](./figs/map.png) ] --- class: left, top, highlight-last-item # Cómo olvidar gráficas tan lindas 🗻 Aunque no lo crean, estas infografías están hechas 100% utilizando **R** .center.mid[ ![:scale 80%](./figs/table.png) ] --- class: left, top, highlight-last-item # Infinidad de recusos increíbles .pull-left.center[ **Presentaciones** ![:scale 30%](https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/xaringan.png) **Reportes** ![:scale 30%](https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/rmarkdown.png) ] .pull-right.center[ **Libros** ![:scale 30%](https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/bookdown.png) **Aplicaciones interactivas** ![:scale 30%](https://raw.githubusercontent.com/rstudio/hex-stickers/master/PNG/shiny.png) ] ??? Hay una infinidad de paquetes y funcionalidades increíbles como las presentaciones de esta materia, que las hicimos con Xaringan y los reportes con RMarkdown o libros con Bookdown y las aplicaciones intercativas con ShinyApps. --- class: center, top # Referencias .left[.big[ - Barrett, T. S. (2019). Six Reasons to Consider Using R in Psychological Research. - Robinson, D. (2017, October). The impressive growth of r. StackOverflow Blog. Retrieved from https://stackoverflow.blog/2017/10/10/impressive-growth-r/ - McElreath, R. (2018). Statistical rethinking: A Bayesian course with examples in R and Stan. Chapman and Hall/CRC. ]]