6  Estadísticos

BASE1<-read.csv("futbol.csv",sep=",",encoding = "latin1")
BASE2<-read.csv("paises.csv",sep=";")

#librerías de graficación
library(ggplot2)         #Gráficos
library(RColorBrewer)    #Colores de los gráficos
library(plyr)            #arrange()
library(forcats)         #fct_rev()
library(agricolae)       #skewness(), kurtosis(), graph.freq()
library(DescTools)       #Mode

6.1 Estadísticos de tendencia central

Mode(BASE1$cards_yellow)
[1] 1
attr(,"freq")
[1] 12
mean(BASE1$cards_yellow); median(BASE1$cards_yellow)
[1] 3.283019
[1] 2

6.2 Estadísticos de posición

median(BASE2$pob)
[1] 8916864
quantile (BASE2$pob, c(.25, .50, .75) )
     25%      50%      75% 
 2087475  8916864 28919540 
options(scipen=999) # para evitar notación científica
summary(BASE2$pob)
      Min.    1st Qu.     Median       Mean    3rd Qu.       Max. 
     11069    2087475    8916864   39943539   28919540 1411100000 

6.3 Gráfico de cajas

arrange(BASE1, desc(height))[1:5, c(1,7) ]
             player height
1  Thibaut Courtois    199
2   Alphonse Areola    195
3      Gerard Piqué    194
4    Raphael Varane    191
5 Jean-Clair Todibo    190
ggplot(data = BASE1, aes( x=squad, y=height)   ) + 
  geom_boxplot(width=0.5, fill="#1F78B4")+     
  labs(size= "",
       x = "Equipo",
       y = "Altura(cm)",
       title = "Gráfico de cajas de las alturas, según equipo. Barcelona y Real Madrid, 2019-2020.")+
    theme(panel.background = element_rect(fill='transparent', color="black"))

6.4 Estadísticos de forma

skewness(BASE2$pob); kurtosis(BASE2$pob)
[1] 8.40648
[1] 75.88925
skewness(BASE1$height); kurtosis(BASE1$height)
[1] 0.6011036
[1] 0.2030509
#Gráfico

G1<- ggplot(data = BASE2, aes( x=pob)) + 
  geom_histogram(fill="#1F78B4") +
  labs(x = "Población",
       y = "Frecuencia",
       title = "Tamaño de poblaciones, \nsegún países. 2021.")+
  theme(panel.background = element_rect(fill='transparent', color="black"))
  
G2<- ggplot(data = BASE1, aes( x=height)) + 
  geom_histogram(fill="#1F78B4", binwidth=4 ) +
  labs(x = "Altura",
       y = "Frecuencia",
       title = "Alturas de jugadores. \nReal Madrid y Barcelona 2019-2020.")+
  theme(panel.background = element_rect(fill='transparent', color="black"))
 
library(patchwork) 
wrap_plots(G1,G2, ncol = 2, nrow = 1,
           widths = c(0.5, 0.5), heights = 0.5)+
  plot_annotation(title = 'Histogramas de dos variables con distintos comportamientos')