← Back to posts
De datos a decisiones con Power BI
DataPythonData analyticsPower BIBI

De datos a decisiones con Power BI

Omargpax · 26 de marzo de 2026

Documentación de dos proyectos desarrollados durante el curso de Inteligencia de Negocios con Power BI (CONECO, 2025); un dashboard corporativo de ventas trimestrales y un explorador visual de supercars con datos de Kaggle.


Durante el curso de Inteligencia de Negocios con Power BI – Nivel Intermedio (CONECO, jul–ago 2025) desarrollé dos proyectos con enfoques distintos: uno empresarial y otro exploratorio con datos abiertos de Kaggle.

Certificado otorgado por CONECO Consultoría & Capacitación · Docente: Ing. Jacinto Regalado


Proyecto 1 — Corp Trimestral Dashboard

Reporte de ventas 2021–2022 para una empresa con múltiples líneas de producto y cobertura nacional en Perú.

Dataset

Datos segmentados por:

Proceso en Power BI

1. Power Query
Limpieza de fechas, normalización de nombres y creación de tabla calendario.

2. Modelo estrella
Tabla de hechos (ventas) relacionada con dimensiones de tiempo, vendedor, producto y región.

3. Medidas DAX

-- Participación por región
Participacion Region =
DIVIDE(
    SUM(Ventas[Monto]),
    CALCULATE(SUM(Ventas[Monto]), ALL(Dim_Region))
)

-- Variación año anterior
Ventas YoY =
CALCULATE(SUM(Ventas[Monto]), SAMEPERIODLASTYEAR(Calendario[Fecha]))

4. Visualizaciones
Gráfico de barras horizontales (ranking de vendedores), matriz cruzada línea × región, gráfico de área temporal y mapa de burbujas sobre Perú.

Hallazgos principales

KPIs por región

RegiónTotal Ventas
LimaS/ 170,997,982
NorteS/ 14,135,817
OrienteS/ 5,279,788
CentroS/ 5,195,176

🔗 Ver dashboard en Power BI Service


Proyecto 2 — Supercars Explorer

Explorador visual de un dataset de supercars de Kaggle, con foco en precio, potencia y aceleración como KPIs principales.

Fuente: Cars Datasets 2025 — Kaggle

Pipeline de limpieza en Python

El dataset original contenía valores mixtos como "70-85 hp" o "1,200 cc", por lo que implementé un pipeline en dos scripts antes de cargar en Power BI.

Script 1 — Extracción y normalización

import pandas as pd
import re

def extract_first_number(val):
    if pd.isna(val):
        return val
    m = re.search(r"[\\d,]+\\.?\\d*", str(val).strip())
    return float(m.group().replace(",", "")) if m else None

# Columnas transformadas:
# CC/Battery Capacity  → CC/Battery Capacity (cc)
# HorsePower           → HorsePower (hp)
# Total Speed          → Total Speed (km/h)
# Performance 0-100    → Performance 0-100 (sec)
# Cars Prices          → Cars Prices (USD)
# Torque               → Torque (Nm)

Salida: Cars_Datasets_2025_clean.csv

Script 2 — Validación y exportación final

# Forzar tipos numéricos
for col in numeric_cols:
    df[col] = pd.to_numeric(df[col], errors="coerce")

# Eliminar filas con >50% de datos nulos
threshold = len(df.columns) * 0.5
df = df.dropna(thresh=threshold)

# Deduplicación por marca + modelo
df = df.drop_duplicates(subset=["Company Names", "Cars Names"])

# Validar rangos lógicos
df = df[df["Total Speed (km/h)"].between(0, 500) | df["Total Speed (km/h)"].isna()]
df = df[df["Cars Prices (USD)"].isna() | (df["Cars Prices (USD)"] > 0)]

Salida: Cars_Datasets_2025_final.csv

Proceso en Power BI

  1. Carga del CSV limpio directo desde Power Query (sin transformaciones adicionales)
  2. Medidas DAX para precio promedio por marca, HP promedio y ranking por aceleración
  3. Slicers en cascada — filtro por marca (Car) → modelo (Model)
  4. Tarjetas KPI para precio, HP, velocidad máxima, aceleración y asientos

KPIs principales

Ejemplo: Tesla Model S

MétricaValor
Precio$88,490
Potencia670 HP
Velocidad máxima250 km/h
0–100 km/h3.1 seg
Asientos5
Motor0.1L (dual electric motors)
Cilindrada100 CC
Torque967 Nm

🔗 Ver dashboard en Power BI Service


Tecnologías utilizadas

HerramientaUso
Power BI DesktopModelado, DAX y diseño de reportes
Power BI ServicePublicación y compartición
Python — pandas / reLimpieza y validación del dataset
KaggleFuente del dataset de supercars

Conclusiones

El pipeline Python → Power BI demostró ser una combinación efectiva: pandas resuelve la suciedad del dato crudo y Power BI se enfoca en el valor visual. El modelo estrella en el proyecto corporativo facilitó medidas DAX reutilizables y consultas rápidas. Los slicers en cascada mejoran notablemente la experiencia de exploración en datasets con jerarquía natural (marca → modelo).

Tip: Si replicás este flujo con otros datasets de Kaggle, el paso más crítico es identificar columnas con unidades mezcladas en texto antes de cargar a Power BI. Un script de limpieza previo ahorra horas de trabajo en Power Query.

Fuente: GitHub