Prólogo (por Yanina Bellini)
Este libro, Fundamentos de ciencia de datos con R, es una guía práctica y completa para adentrarse en el mundo de la ciencia de datos, enfocándose en el lenguaje de programación R. Se nos propone explorar conceptos de estadística, análisis, modelado y comunicación con aplicaciones prácticas que ejemplifican todo el proceso, todo ello en español, :).
No solo se abordan temas técnicos, sino que también se invita al lector a reflexionar sobre si la ciencia de datos merece ser considerada una ciencia, y qué implicaciones y debates éticos conlleva la practica de esta disciplina. Cada capítulo aborda un aspecto fundamental del proceso de la ciencia de datos y el contenido abarca desde la gestión de bases de datos, pasando por la estadística y técnicas avanzadas de modelización, hasta la comunicación de resultados.
A lo largo del libro, se explora la gestión de bases de datos relacionales y NoSQL, así como temas de gobierno y calidad del dato. Se profundiza en la estadística, desde la probabilidad hasta la inferencia y el muestreo, antes de sumergir al lector en la modelización estadística.
También se presenta el aprendizaje automático, abordando tanto algoritmos supervisados como no supervisados: desde árboles de clasificación hasta redes neuronales convolucionales, donde se presentan conceptos técnicos sin perder de vista su aplicabilidad.
El libro finaliza con estrategias para comunicar y colaborar en el ámbito de la ciencia de datos mediante informes reproducibles, la creación de aplicaciones interactivas y el uso de herramientas como Git y GitHub.
Además, se incluyen casos de estudio prácticos, como análisis electorales y predicciones de consumo eléctrico, para conectar los conocimientos adquiridos con situaciones del mundo real.
Este libro se presenta como un material con información sólida y práctica para hacer ciencia de datos y ha sido escrito por más de 50 colaboradores. Y lo hace en nuestro idioma, el español, desde su concepción. Celebro este tipo de iniciativas que eliminan la barrera del idioma y facilitan el acceso al conocimiento por medio de material actualizado y de calidad.
Les doy la bienvenida a este recorrido donde los datos se transforman para darnos información, para que tomemos mejores decisiones, para que aportemos al conocimiento. Espero que este libro se convierta en un compañero útil en su travesía.
Yani Bellini Saibene
Breve biografía
Yanina Bellini Saiben es una investigadora argentina, profesora de grado y posgrado en varias universidades de Argentina y Uruguay. Usa R desde el 2009. Ha desarrollado cursos abiertos y tutoriales para enseñar habilidades técnicas en el manejo de datos, y lidera y participa en la traducción comunitaria al español de material educativo y técnico.
Además, es la Community Manager de rOpenSci y una de las co-fundadoras de LatinR y MetaDocencia. Es formadora, instructora y miembro del directorio de The Carpentries e instructora certificada de Posit. Forma parte del R Consortium Infrastructure Steering Committee y de la Sociedad Argentina de Informática. Es R-Ladies Projec Lead y parte del directorio de R-Ladies Global.