El desarrollo de proyectos de ciencia de datos desde Windows puede beneficiarse enormemente del uso de WSL2 con VS Code Remote. Esta combinación permite aprovechar herramientas y entornos Linux directamente desde el editor, manteniendo la flexibilidad de Windows en tareas cotidianas como análisis, visualización o modelado de datos.
🎯 Objetivo
- Configurar un entorno Linux para ciencia de datos dentro de WSL2
- Integrarlo con Visual Studio Code mediante la extensión Remote - WSL
- Usar Jupyter Notebooks, entornos virtuales y bibliotecas científicas desde VS Code
- Trabajar con flujos reproducibles usando pip, conda y notebooks
🧰 Requisitos previos
- Windows 10/11 con WSL2 activado
- Distro Linux instalada (Ubuntu 22.04 recomendado)
- VS Code con la extensión Remote - WSL
- Python 3, pip y/o conda
⚙️ Paso 1: Instalar dependencias en la distro WSL2
Desde tu terminal WSL:
sudo apt update && sudo apt upgrade -y
sudo apt install -y python3-pip python3-venv git
Instalar bibliotecas de ciencia de datos:
pip install numpy pandas matplotlib seaborn scikit-learn jupyter
Opcional: usar miniconda
si se prefiere conda como gestor de entornos.
💻 Paso 2: Abrir WSL desde VS Code
- Abrí VS Code
- Presioná
Ctrl+Shift+P
y escribí:Remote-WSL: New Window
- Seleccioná tu distribución (ej: Ubuntu)
Ahora estás en una sesión remota con acceso completo a la terminal, Python, Jupyter y entorno Linux desde el editor.
📓 Paso 3: Usar Jupyter Notebooks dentro de VS Code
Instalar extensión oficial de Jupyter en VS Code.
Crear un nuevo notebook (.ipynb
) y seleccioná el kernel Python correspondiente desde el entorno WSL.
Verificá que ejecutás en WSL:
import platform
print(platform.system(), platform.release())
🧪 Ejemplo práctico: Análisis exploratorio
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
df = sns.load_dataset("penguins")
sns.pairplot(df, hue="species")
plt.show()
Este script corre directamente en el entorno WSL, usando la GPU (si está disponible), y sin overhead de traducción de entornos.
🛠️ Buenas prácticas
- Guardar los proyectos en el sistema de archivos Linux (
~/proyectos
, no en/mnt/c/
) para mayor rendimiento - Usar entornos virtuales (
python3 -m venv .venv
) para evitar conflictos - Versionar notebooks y scripts con Git (
git init
) - Añadir
requirements.txt
para reproducibilidad:
pip freeze > requirements.txt
✅ Conclusión
VS Code + Remote WSL ofrece una experiencia fluida para la ciencia de datos en Windows, combinando la potencia de Linux con la comodidad de un entorno gráfico moderno. Con Jupyter, Python y bibliotecas científicas listas para usar, es posible construir, visualizar y entrenar modelos de manera productiva, eficiente y reproducible.
Ver también
- Construcción de un asistente contextual para escritorio usando IA local con acceso al sistema
- Integración de inferencia local ONNX con Windows ML en apps modernas
- Integración con servicios locales vía App Services y extensión de funcionalidades entre apps
- Implementación de Background Tasks persistentes en apps modernas
- Empaquetado de apps modernas con MSIX y configuración avanzada del manifiesto