Analisando propostas

Implementar modelo Whisper da Open Ai (modelo de transcrição de áudio para texto)

Publicado em 28 de Novembro de 2023 dias na Engenharia e Manufatura

Sobre este projeto

Aberto

Requisitos de Hardware
Como vimos anteriormente, o Whisper é relativamente fácil de instalar. No entanto, ele requer hardware avançado. Uma GPU é recomendada se você deseja usar a versão grande do modelo.

Se você usar a biblioteca Python whisper (veja acima), precisará de cerca de 10GB de RAM e 11GB de VRAM. Isso significa que, na prática, você precisará de uma GPU de pelo menos 16GB. Poderia ser, por exemplo, uma NVIDIA Tesla T4 ou uma NVIDIA A10.

Em uma Tesla T4, você transcreverá 30 segundos de áudio em aproximadamente 6 segundos.

Referência: https://nlpcloud.com/how-to-install-and-deploy-whisper-the-best-open-source-alternative-to-google-speech-to-text.html

Escopo envolve:

Selecionar um servidor que atenda os requsitos
Fazer a instalação
Configurar um endpoint para fazer po pois do arquivo mp3 ou m4a e retorno um json text com o valor transcrito.

Categoria Engenharia e Manufatura
Subcategoria Inteligência Artificial
Tamanho do projeto Médio
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário

Prazo de Entrega: Não estabelecido

Outro projetos publicados por V. M.