ElevenLabs im Unterricht
Konkrete Einsatzszenarien: Hörverstehen, Inklusion, Erklärvideos, Grauzonen
Eines der wertvollsten Einsatzszenarien: eigenes Hörverstehen-Material für Fremdsprachen.
Das Problem bisher:
- Lehrmittel-Audios sind oft zu einfach oder zu schwer.
- Passen nicht zur aktuellen Klassensituation.
- Nachvertonung durch Muttersprachler:innen ist teuer und aufwendig.
Mit ElevenLabs in 10 Minuten:
- Schreibe oder generiere einen Text auf dem passenden Niveau (z.B. mit ChatGPT: «Schreibe einen 200-Wörter-Dialog zwischen zwei Teenagern auf Französisch, Niveau B1, Thema: Freizeitaktivitäten.»)
- Wähle in ElevenLabs eine französische Muttersprachler:innen-Stimme aus der Voice Library.
- Füge mit
<break time="500ms" />natürliche Pausen ein. - Generiere und lade die MP3 herunter.
- Erstelle parallel das Transkript und die Verständnisfragen.
Für Dialoge mit mehreren Sprecher:innen:
- Generiere jede Rolle einzeln mit einer anderen Stimme.
- Kombiniere die Audiofiles in iMovie/GarageBand/Audacity.
- Oder nutze ElevenLabs Projects (Bezahl-Tier) – dort gibt es Sprecherwechsel direkt.
Cross-Reference: Für Einstiegs-Podcasts zu einem Thema bleibt NotebookLM Audio Overview oft die bessere Wahl – dort generierst du aus deinen Quellen einen automatischen Dialog. ElevenLabs ist für kontrolliertes, exakt formuliertes Audiomaterial.

Für Schüler:innen mit Leseschwierigkeiten (Legasthenie, Sehbehinderung, nicht-deutsche Erstsprache) sind Text-zu-Audio-Versionen ein echter Gamechanger.
Typische Einsatzszenarien:
- Leseschwäche: Arbeitsblatt wird parallel als MP3 bereitgestellt – Schüler:in hört und liest mit.
- Sehbehinderung: Komplette Vertonung des Materials, inklusive Aufgabenstellungen.
- DaZ-Schüler:innen: Hörversion unterstützt das Textverständnis.
- Podcast-Version einer Lektion – zum Anhören unterwegs (Repetition).
Schneller Workflow:
- Kopiere den Arbeitsblatt-Text in ElevenLabs Studio.
- Wähle eine ruhige, klare deutsche Stimme (Narration-Use-Case).
- Stability auf 60–70% (Konsistenz wichtiger als Emotion bei langen Texten).
- Aufgaben-Nummern explizit ausschreiben: «Aufgabe eins», «Aufgabe zwei».
- Generieren, MP3 downloaden, neben dem Arbeitsblatt im Klassen-Cloud-Ordner ablegen.
Kennzeichnung ist Pflicht:
- Das Audio-Symbol am Arbeitsblatt macht klar: «Audioversion verfügbar».
- Erwähne im Elterngespräch, dass Materialien auch als Audio angeboten werden.

Ein Erklärvideo mit professioneller Sprachspur ist pädagogisch wertvoller – und kostet dich keinen Aufnahme-Nachmittag mehr.
Workflow für Keynote / PowerPoint:
- Schreibe das Skript pro Folie in ein Textdokument.
- Generiere jede Folie separat in ElevenLabs.
- Importiere die MP3s in Keynote/PowerPoint: Einfügen → Audio → Aus Datei.
- Setze die Wiedergabe auf «Automatisch bei Folienbeginn».
- Exportiere als Film (MP4) – fertig ist dein Erklärvideo.
Workflow für iMovie:
- Erstelle dein Videomaterial (Bildschirmaufzeichnung, Folien-Export, etc.).
- Importiere die ElevenLabs-MP3 als Audiospur.
- Trimme und synchronisiere mit dem Video.
- Füge leise Hintergrundmusik dazu (optional, immer unter -20dB).
Für kürzere Clips direkt in ElevenLabs Projects:
- Im Bezahl-Tier verfügbar.
- Unterstützt Kapitelstruktur und Sprecherwechsel.
- Ideal für mehrteilige Erklärserien.
Typische Fallstricke:
- Nicht Text UND Sprache gleichzeitig auf einer Folie – eines muss reduziert werden.
- Timing pro Folie vorher abschätzen (ca. 150 Wörter pro Minute).
- Audiospur immer gegenhören, bevor du das Video an die Klasse gibst.

Mit ElevenLabs sind viele pädagogisch wertvolle Dinge möglich. Einige solltest du trotzdem nicht tun.
Klare No-Gos:
- ❌ Noten-Feedback mit geklonter Stimme – persönliches Feedback braucht persönliche Stimme. Alles andere wirkt entmenschlicht.
- ❌ Elterngespräche automatisiert nachvertonen – selbst wenn du das Transkript hast. Kommunikation auf dieser Ebene bleibt persönlich.
- ❌ Stimme einer abwesenden Kollegin imitieren – auch wenn sie krank ist und du «nur ihre Hausaufgabe weitergeben willst». Klassen müssen wissen, wer spricht.
- ❌ Unauffällige Kennzeichnung – Schüler:innen haben ein Recht zu wissen, wann sie KI-generiertes Material hören.
Grauzonen (sorgfältige Abwägung nötig):
- ⚠️ Eigene geklonte Stimme für Video-Vertretungsunterricht – möglich, aber Klasse vorher informieren.
- ⚠️ Stimmen berühmter Pädagog:innen zitieren – nur mit echten Audio-Ausschnitten, nicht mit geklonten Versionen.
- ⚠️ Hörverstehen-Material mit geklonten Stimmen bekannter Sprecher:innen – Persönlichkeitsrechte prüfen.
Best Practices für den Schulkontext:
- Transparenz: Am Anfang jedes KI-Audios einen kurzen Hinweis einblenden oder als Vorspann einsprechen: «Dieses Audio wurde mit KI generiert.»
- Alternative anbieten: Schüler:innen, die damit nicht arbeiten wollen, sollen den Text in Originalform lesen können.
- Einwilligung bei Stimmmaterial von Kolleg:innen – immer schriftlich, mit Zweckbegrenzung und Widerrufsrecht.
- Speichergrenzen: Lösche Voice Clones, die du nicht mehr brauchst – biometrische Daten sollen nicht unnötig im Cloud-Tier liegen.
- Schüler:innen aufklären: Thematisiere Voice-Cloning-Risiken im Unterricht (Medienkompetenz).

Quiz
1. Was ist ein besonders sinnvoller Einsatz von ElevenLabs für Inklusion?
- Eine geklonte Schüler:innen-Stimme für den Deutsch-Unterricht.
- Audio-Versionen von Arbeitsblättern für Schüler:innen mit Leseschwäche.
- Automatische Noten-Ansagen mit KI-Stimme.
- Übersetzung der Stimmen aller Elternabende.
Lösung anzeigen
Richtige Antwort: b) — Audio-Versionen von Arbeitsblättern sind eine der wertvollsten Einsatzmöglichkeiten: Schüler:innen mit Legasthenie, Sehbehinderung oder DaZ-Hintergrund profitieren davon – und die Erstellung dauert mit ElevenLabs nur wenige Minuten pro Blatt.
2. Welche Kombination ergibt das schnellste massgeschneiderte Hörverstehen-Material?
- ChatGPT schreibt den Text, ElevenLabs vertont ihn, Muttersprachler:in gegenhört.
- ElevenLabs allein, ohne weitere Tools.
- Lehrbuch abtippen und ElevenLabs vertonen.
- Schüler:innen sprechen selbst ein und ElevenLabs klont ihre Stimmen.
Lösung anzeigen
Richtige Antwort: a) — Die effektive Kombination: KI-Textwerkzeug (ChatGPT/Claude) für den Text auf passendem Niveau, ElevenLabs für die Vertonung. Ein kurzes Gegenhören durch Muttersprachler:in oder sorgfältige Eigenkontrolle sichert die Qualität – besonders bei fremdsprachlichem Material.
3. Welches Vorgehen ist beim Einsatz von KI-Audio im Unterricht Pflicht?
- Nur die Lehrperson darf das Audio hören.
- Das Material muss ausgedruckt werden.
- Transparente Kennzeichnung: Schüler:innen wissen, dass es KI-generiert ist.
- Das Audio muss an die Schulleitung gemeldet werden.
Lösung anzeigen
Richtige Antwort: c) — Transparenz ist Pflicht – sowohl ethisch als auch zunehmend rechtlich. Schüler:innen haben das Recht zu wissen, ob sie eine menschliche oder eine KI-Stimme hören. Ein kurzer Hinweis am Anfang des Audios oder auf dem Arbeitsblatt reicht aus.