Tablas de datos

Primeros análisis

🎯 Objetivo de la clase

Pasar de listas sueltas a datos organizados en tablas
y comenzar a analizar información como científicos de datos

🤔 ¿Qué es una tabla de datos?

Una tabla es una forma de organizar información en:

  • Filas → observaciones
  • Columnas → variables

Ejemplo:

nombre edad ciudad
Ana 20 Bogotá
Luis 22 Cali

🧠 En Python

Usamos una estructura llamada:

👉 Lista de diccionarios

personas = [
    {"nombre": "Ana", "edad": 20, "ciudad": "Bogotá"},
    {"nombre": "Luis", "edad": 22, "ciudad": "Cali"},
    {"nombre": "Marta", "edad": 21, "ciudad": "Medellín"}
]

🔍 Explorando un dataset

print(len(personas))        # número de registros
print(personas[0])          # primer registro
print(personas[0]["edad"])  # valor específico

💡 Aquí ya están haciendo análisis sin darse cuenta

📊 Extraer una variable

edades = [p["edad"] for p in personas]
print(edades)

📈 Estadísticas básicas

promedio = sum(edades) / len(edades)
print(promedio)

⚠️ Ojo conceptual

Esto ya es:

👉 Estadística descriptiva
👉 Resumen de datos
👉 Primer paso del análisis de datos

🔥 Ejemplo más realista

Simulemos estudiantes con notas:

estudiantes = [
    {"nombre": "Ana", "nota": 3.5},
    {"nombre": "Luis", "nota": 4.2},
    {"nombre": "Marta", "nota": 2.8},
    {"nombre": "Carlos", "nota": 4.8}
]

📊 Promedio de notas

notas = [e["nota"] for e in estudiantes]
promedio = sum(notas) / len(notas)

print("Promedio:", promedio)

🧠 Identificar patrones

aprobados = [e for e in estudiantes if e["nota"] >= 3.0]

print(len(aprobados))

💡 Ya están filtrando datos (esto es clave en ciencia de datos)

🧪 Nueva variable

Agregar estado:

for e in estudiantes:
    if e["nota"] >= 3.0:
        e["estado"] = "Aprobado"
    else:
        e["estado"] = "Reprobado"

print(estudiantes)

🚀 Nivel GOD (pero suave)

Simular nueva variable:

import random

for e in estudiantes:
    e["horas_estudio"] = random.randint(1, 10)

print(estudiantes)

🤯 Pregunta clave

¿Más horas de estudio → mejor nota?

👉 Ya estamos pensando como científicos de datos

🧠 Conceptos aprendidos

  • Tablas de datos
  • Variables
  • Estadísticas básicas
  • Filtrado
  • Creación de variables nuevas
  • Simulación