BASE1<-read.csv("futbol.csv",sep=",",encoding = "latin1")
BASE2<-read.csv("paises.csv",sep=";")
#librerías de graficación
library(ggplot2) #Gráficos
library(RColorBrewer) #Colores de los gráficos
library(plyr) #arrange()
library(forcats) #fct_rev()
library(agricolae) #skewness(), kurtosis(), graph.freq()
library(DescTools) #Mode6 Estadísticos
6.1 Estadísticos de tendencia central
Mode(BASE1$cards_yellow)[1] 1
attr(,"freq")
[1] 12
mean(BASE1$cards_yellow); median(BASE1$cards_yellow)[1] 3.283019
[1] 2
6.2 Estadísticos de posición
median(BASE2$pob)[1] 8916864
quantile (BASE2$pob, c(.25, .50, .75) ) 25% 50% 75%
2087475 8916864 28919540
options(scipen=999) # para evitar notación científica
summary(BASE2$pob) Min. 1st Qu. Median Mean 3rd Qu. Max.
11069 2087475 8916864 39943539 28919540 1411100000
6.3 Gráfico de cajas
arrange(BASE1, desc(height))[1:5, c(1,7) ] player height
1 Thibaut Courtois 199
2 Alphonse Areola 195
3 Gerard Piqué 194
4 Raphael Varane 191
5 Jean-Clair Todibo 190
ggplot(data = BASE1, aes( x=squad, y=height) ) +
geom_boxplot(width=0.5, fill="#1F78B4")+
labs(size= "",
x = "Equipo",
y = "Altura(cm)",
title = "Gráfico de cajas de las alturas, según equipo. Barcelona y Real Madrid, 2019-2020.")+
theme(panel.background = element_rect(fill='transparent', color="black"))
6.4 Estadísticos de forma
skewness(BASE2$pob); kurtosis(BASE2$pob)[1] 8.40648
[1] 75.88925
skewness(BASE1$height); kurtosis(BASE1$height)[1] 0.6011036
[1] 0.2030509
#Gráfico
G1<- ggplot(data = BASE2, aes( x=pob)) +
geom_histogram(fill="#1F78B4") +
labs(x = "Población",
y = "Frecuencia",
title = "Tamaño de poblaciones, \nsegún países. 2021.")+
theme(panel.background = element_rect(fill='transparent', color="black"))
G2<- ggplot(data = BASE1, aes( x=height)) +
geom_histogram(fill="#1F78B4", binwidth=4 ) +
labs(x = "Altura",
y = "Frecuencia",
title = "Alturas de jugadores. \nReal Madrid y Barcelona 2019-2020.")+
theme(panel.background = element_rect(fill='transparent', color="black"))
library(patchwork)
wrap_plots(G1,G2, ncol = 2, nrow = 1,
widths = c(0.5, 0.5), heights = 0.5)+
plot_annotation(title = 'Histogramas de dos variables con distintos comportamientos')