TL;DR — Resumen Rápido

Ejecuta el modelo Whisper de OpenAI localmente para transcripción de audio gratuita y privada. Incluye CLI, Docker, GPU, whisper.cpp para CPU y opciones de interfaz web.

¿Qué es Whisper?

Whisper es el modelo de reconocimiento de voz de OpenAI — transcribe audio en 99 idiomas, traduce voz y genera subtítulos, todo corriendo localmente.

ModeloTamañoPrecisiónVelocidad GPU
tiny75 MBBuena~32x tiempo real
base142 MBMejor~16x tiempo real
small466 MBMuy buena~6x tiempo real
medium1.5 GBExcelente~2x tiempo real
large-v33 GBLa mejor~1x tiempo real
pip install openai-whisper
whisper audio.mp3 --model base --language es

Artículos Relacionados