Evaluating bids

Implementar modelo Whisper da Open Ai (modelo de transcrição de áudio para texto)

Published on the November 28, 2023 in Engineering & Manufacturing

About this project

Open

Requisitos de Hardware
Como vimos anteriormente, o Whisper é relativamente fácil de instalar. No entanto, ele requer hardware avançado. Uma GPU é recomendada se você deseja usar a versão grande do modelo.

Se você usar a biblioteca Python whisper (veja acima), precisará de cerca de 10GB de RAM e 11GB de VRAM. Isso significa que, na prática, você precisará de uma GPU de pelo menos 16GB. Poderia ser, por exemplo, uma NVIDIA Tesla T4 ou uma NVIDIA A10.

Em uma Tesla T4, você transcreverá 30 segundos de áudio em aproximadamente 6 segundos.

Referência: https://nlpcloud.com/how-to-install-and-deploy-whisper-the-best-open-source-alternative-to-google-speech-to-text.html

Escopo envolve:

Selecionar um servidor que atenda os requsitos
Fazer a instalação
Configurar um endpoint para fazer po pois do arquivo mp3 ou m4a e retorno um json text com o valor transcrito.

Category Engineering & Manufacturing
Subcategory Artificial Intelligence
Project size Medium
Is this a project or a position? Project
Required availability As needed

Delivery term: Not specified

Other projects posted by V. M.