El desarrollo de proyectos de ciencia de datos desde Windows puede beneficiarse enormemente del uso de WSL2 con VS Code Remote. Esta combinación permite aprovechar herramientas y entornos Linux directamente desde el editor, manteniendo la flexibilidad de Windows en tareas cotidianas como análisis, visualización o modelado de datos.
🎯 Objetivo Link to heading
- Configurar un entorno Linux para ciencia de datos dentro de WSL2
- Integrarlo con Visual Studio Code mediante la extensión Remote - WSL
- Usar Jupyter Notebooks, entornos virtuales y bibliotecas científicas desde VS Code
- Trabajar con flujos reproducibles usando pip, conda y notebooks
🧰 Requisitos previos Link to heading
- Windows 10/11 con WSL2 activado
- Distro Linux instalada (Ubuntu 22.04 recomendado)
- VS Code con la extensión Remote - WSL
- Python 3, pip y/o conda
⚙️ Paso 1: Instalar dependencias en la distro WSL2 Link to heading
Desde tu terminal WSL:
sudo apt update && sudo apt upgrade -y
sudo apt install -y python3-pip python3-venv git
Instalar bibliotecas de ciencia de datos:
pip install numpy pandas matplotlib seaborn scikit-learn jupyter
Opcional: usar miniconda
si se prefiere conda como gestor de entornos.
💻 Paso 2: Abrir WSL desde VS Code Link to heading
- Abrí VS Code
- Presioná
Ctrl+Shift+P
y escribí:Remote-WSL: New Window
- Seleccioná tu distribución (ej: Ubuntu)
Ahora estás en una sesión remota con acceso completo a la terminal, Python, Jupyter y entorno Linux desde el editor.
📓 Paso 3: Usar Jupyter Notebooks dentro de VS Code Link to heading
Instalar extensión oficial de Jupyter en VS Code.
Crear un nuevo notebook (.ipynb
) y seleccioná el kernel Python correspondiente desde el entorno WSL.
Verificá que ejecutás en WSL:
import platform
print(platform.system(), platform.release())
🧪 Ejemplo práctico: Análisis exploratorio Link to heading
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
df = sns.load_dataset("penguins")
sns.pairplot(df, hue="species")
plt.show()
Este script corre directamente en el entorno WSL, usando la GPU (si está disponible), y sin overhead de traducción de entornos.
🛠️ Buenas prácticas Link to heading
- Guardar los proyectos en el sistema de archivos Linux (
~/proyectos
, no en/mnt/c/
) para mayor rendimiento - Usar entornos virtuales (
python3 -m venv .venv
) para evitar conflictos - Versionar notebooks y scripts con Git (
git init
) - Añadir
requirements.txt
para reproducibilidad:
pip freeze > requirements.txt
✅ Conclusión Link to heading
VS Code + Remote WSL ofrece una experiencia fluida para la ciencia de datos en Windows, combinando la potencia de Linux con la comodidad de un entorno gráfico moderno. Con Jupyter, Python y bibliotecas científicas listas para usar, es posible construir, visualizar y entrenar modelos de manera productiva, eficiente y reproducible.