Whisper

Modèle avancé de reconnaissance et traduction automatique de la parole, multilingue.

IA & Data

Création de contenu

NaN

free

Description

Whisper est un modèle d'apprentissage automatique avancé pour la reconnaissance automatique de la parole (ASR) et la traduction vocale, développé par OpenAI. Il utilise une architecture Transformer basée sur un encodeur-décodeur, capable de fonctionner en séquence à séquence. Whisper a été pré-entraîné sur un immense corpus de données audio étiquetées (680 000 heures) et est disponible en plusieurs tailles et versions, dont des modèles exclusivement anglophones et des modèles multilingues. Les modèles multilingues peuvent effectuer aussi bien la reconnaissance de la parole que la traduction vocale, adaptant la sortie à la langue d'origine ou à une langue cible différente.

Fonctionnalités

Reconnaissance automatique de la parole (ASR)
Transcrit des fichiers audio en texte dans la même langue que l’audio.
Traduction vocale
Transcrit et traduit des fichiers audio dans une langue différente de celle d’origine.
Modèles multilingues
Prise en charge de nombreuses langues pour la reconnaissance et la traduction.
Différentes tailles de modèles
Disponible en versions tiny, base, small, medium, large, afin d'adapter la puissance de calcul et la précision selon les besoins.

Plans et tarification

Open source

Tous les modèles Whisper sont disponibles en open source, téléchargeables et utilisables gratuitement.

Voir tous les détails de tarification

Outils à découvrir

Ora AI

Plateforme pour créer et personnaliser facilement des chatbots et solutions d'intelligence artificielle avec analyse avancée des données et intégration sans code.

RhetorAI

Outil automatisé d'entretiens avec les utilisateurs pour mieux comprendre leurs besoins et améliorer le produit.

HelloScribe

HelloScribe est un outil AI qui génère des plans détaillés et des contenus de haute qualité à partir de instructions écrites.

Accueil Marketplace IA

Whisper

Description

Fonctionnalités

Reconnaissance automatique de la parole (ASR)

Traduction vocale

Modèles multilingues

Différentes tailles de modèles