1  Preliminares

1.1 Bases de datos

Las bases de datos que se trabajarán en los ejemplos de este libro se pueden descargar del enlace: https://drive.google.com/drive/folders/1IuZBAQBhJmgxpHIHJG3RiE_hMNWXE4cF?usp=sharing

A continuación se presentan las descripciones de cada una de ellas.

Base de datos: Fútbol

Esta base presenta variables del perfil y el desempeño de los futbolistas del Barcelona y el Real Madrid durante la temporada 2019-2020. La base solo contiene futbolistas que jugaron al menos un partido. El nombre de la bases es “futbol.csv”.

La base es una pequeña parte de la base denominada Soccer players values and their statistics https://www.kaggle.com/datasets/kriegsmaschine/soccer-players-values-and-their-statistics

Las variables de esta base de datos son:

  • player: Nombre del jugador.
  • nationality: Nacionalidad del jugador.
  • position: Posición del jugador.
  • squad: Nombre de equipo.
  • Age: Edad.
  • Value: Valor en euros.
  • Height: Altura en cm.
  • foot: Pie dominante.
  • games: Cantidad de partidos jugados en La Liga.
  • minutes: Cantidad de minutos jugados en La Liga.
  • goals: Cantidad de goles en La Liga.
  • assists: Cantidad de asistencias en La Liga.
  • cards_yellow: Cantidad de tarjetas amarillas en La Liga.
  • cards_red: Cantidad de tarjetas rojas en La Liga.
  • passes_completed: Cantidad de pases completados en La Liga.
  • fouls: Cantidad de faltas en La Liga.
  • interceptions: Cantidad de intercepciones en La Liga.

Base de datos: Países

Esta base presenta variables demográficas y económicas de los 195 países reconocidos por las Naciones Unidas, durante el año 2021. El nombre de la bases es “Paises.csv”.

Los datos fueron descargados del sistema de gestión de descarga de datos del Banco Mundial y de la página del Programa de las Naciones Unidas para el Desarrollo, sus enlaces son:

Las variables que incluye esta base son las siguientes:

  • cod: Código oficial de las Naciones Unidas para cada país.
  • name: Nombre del país.
  • area: Cantidad de Km\(^2\) del país.
  • pob: Número de habitantes en el 2020.
  • HDIrank20-HDIrank21: Posición en la casificaión según el HDI en los años 2020 y 2021.
  • hdi_2010 - hdi_2021: Puntuación en el Índice de Desarrollo Humano en los años 2010 al 2021.
  • le_2010-le_2021: Expectativa de vida en los años del 2010 al 2021.
  • Sch_exp21: Expectativa de años de escolaridad en el 2021.
  • Sch_mean21: Promedio de años de escolaridad en el 2021.
  • GNI_pc21: Producto Nacional Bruto per cápita en el 2021.
  • GNIminHDI21: Ranking en el Producto Nacional Bruto per cápita en el 2021, menos la posición en el HDI21.
  • region: Región a la que pertence el país: Arabian States, developed countries, East Asia and the Pacific, Europe and Central Asia, Latin America and Caribbean, South Asia and SubSaharian Africa (AS, DC, EAP, ECA, LAC, SA, SSA).

Base de datos: Spotify

Esta base de datos contiene las 200 canciones más escuchadas en el 2023 en Spotify. El nombre de la bases es “Spotify23.csv”.La base fuente se ubica en el enlace https://www.kaggle.com/datasets/nelgiriyewithana/top-spotify-songs-2023?resource=download

Las variables que incluye son las siguientes:

  • name: Nombre de la canción
  • artist_count: Número de artistas que participan en la canción
  • year: Año en el que salió la canción
  • in_spotify_charts: Número de veces que la canción apareció en las listas de las canciones más escuchadas de spotify
  • bpm: Beats por minuto
  • key: Acorde de la canción
  • mode: Modo del acorde de la canción (amyor o menor)
  • danceability_%: Indicador de presencia de elementos bailables en la canción [0-100]
  • valence_%: Indicador de presencia de contenido positivo en la canción [0-100]
  • energy_%: Indicador de presencia de energía percibida en la canción [0-100]
  • acousticness_%: Indicador de presencia de elementos acústicos en la canción [0-100]
  • instrumentalness_%: Indicador de presencia de contenido instrumental en la canción [0-100]
  • liveness_%: Indicador de presencia de elementos en vivo de la canción [0-100]
  • speechiness_%: Indicador de presencia de palabras habladas en la canción [0-100]
  • artist: Nombre del artista principal de la canción
  • artist2 - artist4 : Nombres de los artistas colaboradores, según el orden de aparición en los créditos de la canción

Base de datos: German Test Anxiety Inventory

  • GTAI1 Tuve seguridad en mi capacidad [FC]
  • GTAI2 Pensé en la importancia que el examen tenía para mí [PR]
  • GTAI3 Tuve una sensación rara en mi estomago [EM]
  • GTAI4 Me bloqueé por los pensamientos que me pasaban por la cabeza [IN]
  • GTAI5 Me preocupó saber si podía afrontar el examen [PR]
  • GTAI6 Sentí mi cuerpo tenso [EM]
  • GTAI7 Tuve confianza en mi propio desempeño [FC]
  • GTAI8 Pensé en las consecuencias de fracasar en el examen [PR]
  • GTAI9 Me pregunté si mi rendimiento sería lo suficientemente bueno [PR]
  • GTAI10 Me distraje por pensar en cualquier cosa [IN]
  • GTAI11 Me sentí incómodo/a [EM]
  • GTAI12 Sentí que podía confiar en mí mismo [FC]
  • GTAI13 Pensé en lo mucho que me importaba obtener un buen resultado [PR]
  • GTAI14 Perdí el hilo de mis pensamientos fácilmente [IN]
  • GTAI15 Sentí que mi corazón latía fuertemente [EM]
  • GTAI16 Me preocupó el resultado de mi examen [PR]
  • GTAI17 Me sentí intranquilo/a [EM]
  • GTAI18 Tuve dificultades para recordar las cosas debido a que estaba pensando en mis problemas [IN]
  • GTAI19 Me sentí conforme conmigo mismo/a [FC]
  • GTAI20 Me preocupó cómo se vería mi calificación [PR]
  • GTAI21 Temblé de nerviosismo [EM]
  • GTAI22 Me preocupó que algo saliera mal [PR]
  • GTAI23 Interrumpí mi razonamiento porque algo de poca importancia llamó mi atención [IN]
  • GTAI24 Tuve una sensación de angustia [EM]
  • GTAI25 Confié que lograría resolver todo el examen [FC]
  • GTAI26 Pensé en lo que pasaría si me iba mal [PR]
  • GTAI27 Me sentí nervioso/a [EM]
  • GTAI28 Me sentí convencido/a de que haría bien el examen [FC]
  • GTAI29 Tuve dificultades en la concentración debido a que me distraía con algún pensamiento [IN]
  • sex Sexo de la persona