Instalar y usar Openai/Whisper en Docker
Whisper es un modelo de reconocimiento de voz de propósito general. Está entrenado en un gran conjunto de datos de audio diverso y también es un modelo multitarea que puede realizar reconocimiento de voz multilingüe, traducción de voz e identificación de idiomas.
Requisitos:
Antes de empezar, asegúrate de tener Docker instalado en tu ordenador. Si no lo tienes instalado, puedes seguir el siguiente tutorial para instalarlo en Ubuntu/Debian: https://www.hircoir.eu.org/instalar-docker-portainer-en-ubuntu/
Si tienes un sistema operativo puedes descargarlo desde el sitio web oficial de Docker: https://www.docker.com/get-started
Paso 1: Descarga el Dockerfile
El primer paso es descargar el Dockerfile que has creado. Puedes hacerlo clonando el repositorio de GitHub donde lo has guardado:
git clone
https://github.com/HirCoir/OpenAI-Whisper-Dockerfile
Reemplaza USERNAME
y REPOSITORY
con tu nombre de usuario y el nombre del repositorio donde has guardado el Dockerfile.
Paso 2: Crea la imagen Docker
Una vez que tengas el Dockerfile en tu ordenador, puedes crear la imagen Docker utilizando el comando docker build
.
Ve al directorio donde has guardado el Dockerfile y ejecuta el siguiente comando:
docker build -t hircoir/whisper-vscode .
Este comando creará una imagen Docker con el nombre hircoir/whisper-vscode
utilizando el Dockerfile que acabas de descargar. El punto al final del comando indica que el Dockerfile está en la carpeta actual.
Paso 3: Ejecuta el contenedor Docker
Una vez que se haya creado la imagen Docker, puedes ejecutar el contenedor utilizando el comando docker run
.
Ejecuta el contenedor, (en Pass13133 reemplázalo por una contraseña diferente ya que es la que usarás para acceder a vscode-web)
docker run -d --name=whisper-vscode --restart=always -e PASSWORD=Pass13133 -p 8080:8080 hircoir/whisper-vscode
Este comando iniciará el contenedor Docker y lo hará accesible desde tu navegador web en http://localhost:8080
. El parámetro -p 8080:8080
indica que el puerto 8080 del contenedor Docker se mapeará al puerto 8080 de tu ordenador.
Usar Whisper desde una imagen ya existente en dockerhub:
AMD64/x86_x64
docker run -d --name=whisper-vscode --restart=always -e PASSWORD=Pass13133 -p 8080:8080 hircoir/whisper-vscode:amd64
ARM64
docker run -d --name=whisper-vscode --restart=always -e PASSWORD=Pass13133 -p 8080:8080 hircoir/whisper-vscode:arm64
Paso 4: Accede a VSCode y Whisper
Abre tu navegador web y accede a http://ip-docker-server:8080
. Se te pedirá que introduzcas una contraseña para iniciar sesión en VSCode. Utiliza la contraseña que estableciste al iniciar el contenedor.
Una vez que hayas iniciado sesión, verás la interfaz de VSCode. Para acceder a Whisper, escribe menu
en la terminal de VSCode y presiona Enter. Esto abrirá un menú con funciones básicas de Whisper, como transcribir un archivo de audio o transcribir y traducir a un idioma diferente.
¡Eso es todo! Ahora puedes usar Whisper con VSCode en un contenedor Docker.