ElevenLabs im Unterricht – Digitales Pausenbrot

Digitales Pausenbrot · 16. April 2026

Konkrete Einsatzszenarien: Hörverstehen, Inklusion, Erklärvideos, Grauzonen

1 Hörverstehen-Material selbst erstellen ▾

Eines der wertvollsten Einsatzszenarien: eigenes Hörverstehen-Material für Fremdsprachen.

Das Problem bisher:

Lehrmittel-Audios sind oft zu einfach oder zu schwer.
Passen nicht zur aktuellen Klassensituation.
Nachvertonung durch Muttersprachler:innen ist teuer und aufwendig.

Mit ElevenLabs in 10 Minuten:

Schreibe oder generiere einen Text auf dem passenden Niveau (z.B. mit ChatGPT: «Schreibe einen 200-Wörter-Dialog zwischen zwei Teenagern auf Französisch, Niveau B1, Thema: Freizeitaktivitäten.»)
Wähle in ElevenLabs eine französische Muttersprachler:innen-Stimme aus der Voice Library.
Füge mit <break time="500ms" /> natürliche Pausen ein.
Generiere und lade die MP3 herunter.
Erstelle parallel das Transkript und die Verständnisfragen.

Für Dialoge mit mehreren Sprecher:innen:

Generiere jede Rolle einzeln mit einer anderen Stimme.
Kombiniere die Audiofiles in iMovie/GarageBand/Audacity.
Oder nutze ElevenLabs Projects (Bezahl-Tier) – dort gibt es Sprecherwechsel direkt.

Cross-Reference: Für Einstiegs-Podcasts zu einem Thema bleibt NotebookLM Audio Overview oft die bessere Wahl – dort generierst du aus deinen Quellen einen automatischen Dialog. ElevenLabs ist für kontrolliertes, exakt formuliertes Audiomaterial.

Kombiniere ElevenLabs mit ChatGPT oder Claude: KI schreibt den Text auf gewünschtem Niveau, ElevenLabs vertont ihn. In 15 Minuten hast du ein massgeschneidertes Hörverstehen-Material.

Als erledigt markieren

2 Inklusion: Arbeitsblätter als Audio ▾

Für Schüler:innen mit Leseschwierigkeiten (Legasthenie, Sehbehinderung, nicht-deutsche Erstsprache) sind Text-zu-Audio-Versionen ein echter Gamechanger.

Typische Einsatzszenarien:

Leseschwäche: Arbeitsblatt wird parallel als MP3 bereitgestellt – Schüler:in hört und liest mit.
Sehbehinderung: Komplette Vertonung des Materials, inklusive Aufgabenstellungen.
DaZ-Schüler:innen: Hörversion unterstützt das Textverständnis.
Podcast-Version einer Lektion – zum Anhören unterwegs (Repetition).

Schneller Workflow:

Kopiere den Arbeitsblatt-Text in ElevenLabs Studio.
Wähle eine ruhige, klare deutsche Stimme (Narration-Use-Case).
Stability auf 60–70% (Konsistenz wichtiger als Emotion bei langen Texten).
Aufgaben-Nummern explizit ausschreiben: «Aufgabe eins», «Aufgabe zwei».
Generieren, MP3 downloaden, neben dem Arbeitsblatt im Klassen-Cloud-Ordner ablegen.

Kennzeichnung ist Pflicht:

Das Audio-Symbol am Arbeitsblatt macht klar: «Audioversion verfügbar».
Erwähne im Elterngespräch, dass Materialien auch als Audio angeboten werden.

Einmal eingerichtet, kannst du ein 2-Seiten-Arbeitsblatt in 3 Minuten vertonen. Das ist schneller, als es einmal selbst vorzulesen – und die Schüler:innen können es beliebig oft anhören.

Als erledigt markieren

3 Vertonung von Erklärvideos und Präsentationen ▾

Ein Erklärvideo mit professioneller Sprachspur ist pädagogisch wertvoller – und kostet dich keinen Aufnahme-Nachmittag mehr.

Workflow für Keynote / PowerPoint:

Schreibe das Skript pro Folie in ein Textdokument.
Generiere jede Folie separat in ElevenLabs.
Importiere die MP3s in Keynote/PowerPoint: Einfügen → Audio → Aus Datei.
Setze die Wiedergabe auf «Automatisch bei Folienbeginn».
Exportiere als Film (MP4) – fertig ist dein Erklärvideo.

Workflow für iMovie:

Erstelle dein Videomaterial (Bildschirmaufzeichnung, Folien-Export, etc.).
Importiere die ElevenLabs-MP3 als Audiospur.
Trimme und synchronisiere mit dem Video.
Füge leise Hintergrundmusik dazu (optional, immer unter -20dB).

Für kürzere Clips direkt in ElevenLabs Projects:

Im Bezahl-Tier verfügbar.
Unterstützt Kapitelstruktur und Sprecherwechsel.
Ideal für mehrteilige Erklärserien.

Typische Fallstricke:

Nicht Text UND Sprache gleichzeitig auf einer Folie – eines muss reduziert werden.
Timing pro Folie vorher abschätzen (ca. 150 Wörter pro Minute).
Audiospur immer gegenhören, bevor du das Video an die Klasse gibst.

Halte pro Folie maximal 100 Wörter Sprechertext. Längere Abschnitte wirken im Video zäh – lieber eine Folie mehr einbauen.

Als erledigt markieren

4 Grenzen und Grauzonen im Schulkontext ▾

Mit ElevenLabs sind viele pädagogisch wertvolle Dinge möglich. Einige solltest du trotzdem nicht tun.

Klare No-Gos:

❌ Noten-Feedback mit geklonter Stimme – persönliches Feedback braucht persönliche Stimme. Alles andere wirkt entmenschlicht.
❌ Elterngespräche automatisiert nachvertonen – selbst wenn du das Transkript hast. Kommunikation auf dieser Ebene bleibt persönlich.
❌ Stimme einer abwesenden Kollegin imitieren – auch wenn sie krank ist und du «nur ihre Hausaufgabe weitergeben willst». Klassen müssen wissen, wer spricht.
❌ Unauffällige Kennzeichnung – Schüler:innen haben ein Recht zu wissen, wann sie KI-generiertes Material hören.

Grauzonen (sorgfältige Abwägung nötig):

⚠️ Eigene geklonte Stimme für Video-Vertretungsunterricht – möglich, aber Klasse vorher informieren.
⚠️ Stimmen berühmter Pädagog:innen zitieren – nur mit echten Audio-Ausschnitten, nicht mit geklonten Versionen.
⚠️ Hörverstehen-Material mit geklonten Stimmen bekannter Sprecher:innen – Persönlichkeitsrechte prüfen.

Best Practices für den Schulkontext:

Transparenz: Am Anfang jedes KI-Audios einen kurzen Hinweis einblenden oder als Vorspann einsprechen: «Dieses Audio wurde mit KI generiert.»
Alternative anbieten: Schüler:innen, die damit nicht arbeiten wollen, sollen den Text in Originalform lesen können.
Einwilligung bei Stimmmaterial von Kolleg:innen – immer schriftlich, mit Zweckbegrenzung und Widerrufsrecht.
Speichergrenzen: Lösche Voice Clones, die du nicht mehr brauchst – biometrische Daten sollen nicht unnötig im Cloud-Tier liegen.
Schüler:innen aufklären: Thematisiere Voice-Cloning-Risiken im Unterricht (Medienkompetenz).

📋 Stelle eine Sammlung von 10 konkreten Unterrichtsszenarien mit ElevenLabs bereit (Fach, Stufe, Aufwand, Vorlage) – inklusive rechtlicher Hinweise pro Szenario.

10 Unterrichtsszenarien mit ElevenLabs (.pdf)

🔒 Eine gute Faustregel: Frag dich vor jedem KI-Audio: «Würde ich das so auch mit meiner echten Stimme machen?» Wenn die Antwort nein ist, sollte es auch die KI-Version nicht tun.

Als erledigt markieren

Quiz

1. Was ist ein besonders sinnvoller Einsatz von ElevenLabs für Inklusion?

Eine geklonte Schüler:innen-Stimme für den Deutsch-Unterricht.
Audio-Versionen von Arbeitsblättern für Schüler:innen mit Leseschwäche.
Automatische Noten-Ansagen mit KI-Stimme.
Übersetzung der Stimmen aller Elternabende.

Lösung anzeigen

Richtige Antwort: b) — Audio-Versionen von Arbeitsblättern sind eine der wertvollsten Einsatzmöglichkeiten: Schüler:innen mit Legasthenie, Sehbehinderung oder DaZ-Hintergrund profitieren davon – und die Erstellung dauert mit ElevenLabs nur wenige Minuten pro Blatt.

2. Welche Kombination ergibt das schnellste massgeschneiderte Hörverstehen-Material?

ChatGPT schreibt den Text, ElevenLabs vertont ihn, Muttersprachler:in gegenhört.
ElevenLabs allein, ohne weitere Tools.
Lehrbuch abtippen und ElevenLabs vertonen.
Schüler:innen sprechen selbst ein und ElevenLabs klont ihre Stimmen.

Lösung anzeigen

Richtige Antwort: a) — Die effektive Kombination: KI-Textwerkzeug (ChatGPT/Claude) für den Text auf passendem Niveau, ElevenLabs für die Vertonung. Ein kurzes Gegenhören durch Muttersprachler:in oder sorgfältige Eigenkontrolle sichert die Qualität – besonders bei fremdsprachlichem Material.

3. Welches Vorgehen ist beim Einsatz von KI-Audio im Unterricht Pflicht?

Nur die Lehrperson darf das Audio hören.
Das Material muss ausgedruckt werden.
Transparente Kennzeichnung: Schüler:innen wissen, dass es KI-generiert ist.
Das Audio muss an die Schulleitung gemeldet werden.

Lösung anzeigen

Richtige Antwort: c) — Transparenz ist Pflicht – sowohl ethisch als auch zunehmend rechtlich. Schüler:innen haben das Recht zu wissen, ob sie eine menschliche oder eine KI-Stimme hören. Ein kurzer Hinweis am Anfang des Audios oder auf dem Arbeitsblatt reicht aus.