Cascaded STST - Arabisch/Französisch

Speech-to-Speech Translation mit Arabisch oder Französisch als Zielsprache.

Laut Beschreibung:

  • Whisper wird "getrickst": task="transcribe" + language="fr"
  • SpeechT5 generiert Englisch (einzige Möglichkeit)

Pipeline:

  1. 🎤 Speech → Whisper (Transkribiert in Zielsprache)
  2. 📝 Text → SpeechT5 (Generiert englische Sprache)
  3. 🔊 Ausgabe ist Englisch mit französischem/arabischem Inhalt
Zielsprache