Modelos para Audio | Audio Models

Transcripción, voz y generación musical. Modelos: Whisper Large v3 / Turbo (transcripción), XTTS v2 (clonación de voz), MusicGen (música).

Transcription, voice cloning and music generation. Models: Whisper, XTTS, MusicGen.

👉 Whisper corre incluso en GPUs modestas. Para clonación de voz recomendado RTX 4060 Ti 16GB.

Omitir para ir a lista de resultados

Filtros activos:

0 artículos
Columna de cuadrícula
Columna de cuadrícula

Filtro

Filtros activos:

No se encontró ningún producto.

Prueba a utilizar menos filtros o elimina todos los filtros.