ElevenLabs im Unterricht

Digitales Pausenbrot · 16. April 2026

Konkrete Einsatzszenarien: Hörverstehen, Inklusion, Erklärvideos, Grauzonen

1 Hörverstehen-Material selbst erstellen

Eines der wertvollsten Einsatzszenarien: eigenes Hörverstehen-Material für Fremdsprachen.

Das Problem bisher:

  • Lehrmittel-Audios sind oft zu einfach oder zu schwer.
  • Passen nicht zur aktuellen Klassensituation.
  • Nachvertonung durch Muttersprachler:innen ist teuer und aufwendig.

Mit ElevenLabs in 10 Minuten:

  1. Schreibe oder generiere einen Text auf dem passenden Niveau (z.B. mit ChatGPT: «Schreibe einen 200-Wörter-Dialog zwischen zwei Teenagern auf Französisch, Niveau B1, Thema: Freizeitaktivitäten.»)
  2. Wähle in ElevenLabs eine französische Muttersprachler:innen-Stimme aus der Voice Library.
  3. Füge mit <break time="500ms" /> natürliche Pausen ein.
  4. Generiere und lade die MP3 herunter.
  5. Erstelle parallel das Transkript und die Verständnisfragen.

Für Dialoge mit mehreren Sprecher:innen:

  • Generiere jede Rolle einzeln mit einer anderen Stimme.
  • Kombiniere die Audiofiles in iMovie/GarageBand/Audacity.
  • Oder nutze ElevenLabs Projects (Bezahl-Tier) – dort gibt es Sprecherwechsel direkt.

Cross-Reference: Für Einstiegs-Podcasts zu einem Thema bleibt NotebookLM Audio Overview oft die bessere Wahl – dort generierst du aus deinen Quellen einen automatischen Dialog. ElevenLabs ist für kontrolliertes, exakt formuliertes Audiomaterial.

elevenlabs-unterricht-step-1.png
Kombiniere ElevenLabs mit ChatGPT oder Claude: KI schreibt den Text auf gewünschtem Niveau, ElevenLabs vertont ihn. In 15 Minuten hast du ein massgeschneidertes Hörverstehen-Material.
2 Inklusion: Arbeitsblätter als Audio

Für Schüler:innen mit Leseschwierigkeiten (Legasthenie, Sehbehinderung, nicht-deutsche Erstsprache) sind Text-zu-Audio-Versionen ein echter Gamechanger.

Typische Einsatzszenarien:

  • Leseschwäche: Arbeitsblatt wird parallel als MP3 bereitgestellt – Schüler:in hört und liest mit.
  • Sehbehinderung: Komplette Vertonung des Materials, inklusive Aufgabenstellungen.
  • DaZ-Schüler:innen: Hörversion unterstützt das Textverständnis.
  • Podcast-Version einer Lektion – zum Anhören unterwegs (Repetition).

Schneller Workflow:

  1. Kopiere den Arbeitsblatt-Text in ElevenLabs Studio.
  2. Wähle eine ruhige, klare deutsche Stimme (Narration-Use-Case).
  3. Stability auf 60–70% (Konsistenz wichtiger als Emotion bei langen Texten).
  4. Aufgaben-Nummern explizit ausschreiben: «Aufgabe eins», «Aufgabe zwei».
  5. Generieren, MP3 downloaden, neben dem Arbeitsblatt im Klassen-Cloud-Ordner ablegen.

Kennzeichnung ist Pflicht:

  • Das Audio-Symbol am Arbeitsblatt macht klar: «Audioversion verfügbar».
  • Erwähne im Elterngespräch, dass Materialien auch als Audio angeboten werden.
elevenlabs-unterricht-step-2.png
Einmal eingerichtet, kannst du ein 2-Seiten-Arbeitsblatt in 3 Minuten vertonen. Das ist schneller, als es einmal selbst vorzulesen – und die Schüler:innen können es beliebig oft anhören.
3 Vertonung von Erklärvideos und Präsentationen

Ein Erklärvideo mit professioneller Sprachspur ist pädagogisch wertvoller – und kostet dich keinen Aufnahme-Nachmittag mehr.

Workflow für Keynote / PowerPoint:

  1. Schreibe das Skript pro Folie in ein Textdokument.
  2. Generiere jede Folie separat in ElevenLabs.
  3. Importiere die MP3s in Keynote/PowerPoint: Einfügen → Audio → Aus Datei.
  4. Setze die Wiedergabe auf «Automatisch bei Folienbeginn».
  5. Exportiere als Film (MP4) – fertig ist dein Erklärvideo.

Workflow für iMovie:

  1. Erstelle dein Videomaterial (Bildschirmaufzeichnung, Folien-Export, etc.).
  2. Importiere die ElevenLabs-MP3 als Audiospur.
  3. Trimme und synchronisiere mit dem Video.
  4. Füge leise Hintergrundmusik dazu (optional, immer unter -20dB).

Für kürzere Clips direkt in ElevenLabs Projects:

  • Im Bezahl-Tier verfügbar.
  • Unterstützt Kapitelstruktur und Sprecherwechsel.
  • Ideal für mehrteilige Erklärserien.

Typische Fallstricke:

  • Nicht Text UND Sprache gleichzeitig auf einer Folie – eines muss reduziert werden.
  • Timing pro Folie vorher abschätzen (ca. 150 Wörter pro Minute).
  • Audiospur immer gegenhören, bevor du das Video an die Klasse gibst.
elevenlabs-unterricht-step-3.png
Halte pro Folie maximal 100 Wörter Sprechertext. Längere Abschnitte wirken im Video zäh – lieber eine Folie mehr einbauen.
4 Grenzen und Grauzonen im Schulkontext

Mit ElevenLabs sind viele pädagogisch wertvolle Dinge möglich. Einige solltest du trotzdem nicht tun.

Klare No-Gos:

  • Noten-Feedback mit geklonter Stimme – persönliches Feedback braucht persönliche Stimme. Alles andere wirkt entmenschlicht.
  • Elterngespräche automatisiert nachvertonen – selbst wenn du das Transkript hast. Kommunikation auf dieser Ebene bleibt persönlich.
  • Stimme einer abwesenden Kollegin imitieren – auch wenn sie krank ist und du «nur ihre Hausaufgabe weitergeben willst». Klassen müssen wissen, wer spricht.
  • Unauffällige Kennzeichnung – Schüler:innen haben ein Recht zu wissen, wann sie KI-generiertes Material hören.

Grauzonen (sorgfältige Abwägung nötig):

  • ⚠️ Eigene geklonte Stimme für Video-Vertretungsunterricht – möglich, aber Klasse vorher informieren.
  • ⚠️ Stimmen berühmter Pädagog:innen zitieren – nur mit echten Audio-Ausschnitten, nicht mit geklonten Versionen.
  • ⚠️ Hörverstehen-Material mit geklonten Stimmen bekannter Sprecher:innen – Persönlichkeitsrechte prüfen.

Best Practices für den Schulkontext:

  1. Transparenz: Am Anfang jedes KI-Audios einen kurzen Hinweis einblenden oder als Vorspann einsprechen: «Dieses Audio wurde mit KI generiert.»
  2. Alternative anbieten: Schüler:innen, die damit nicht arbeiten wollen, sollen den Text in Originalform lesen können.
  3. Einwilligung bei Stimmmaterial von Kolleg:innen – immer schriftlich, mit Zweckbegrenzung und Widerrufsrecht.
  4. Speichergrenzen: Lösche Voice Clones, die du nicht mehr brauchst – biometrische Daten sollen nicht unnötig im Cloud-Tier liegen.
  5. Schüler:innen aufklären: Thematisiere Voice-Cloning-Risiken im Unterricht (Medienkompetenz).
📋 Stelle eine Sammlung von 10 konkreten Unterrichtsszenarien mit ElevenLabs bereit (Fach, Stufe, Aufwand, Vorlage) – inklusive rechtlicher Hinweise pro Szenario.
elevenlabs-unterricht-step-4.png
10 Unterrichtsszenarien mit ElevenLabs (.pdf)
🔒 Eine gute Faustregel: Frag dich vor jedem KI-Audio: «Würde ich das so auch mit meiner echten Stimme machen?» Wenn die Antwort nein ist, sollte es auch die KI-Version nicht tun.

Quiz

1. Was ist ein besonders sinnvoller Einsatz von ElevenLabs für Inklusion?

  1. Eine geklonte Schüler:innen-Stimme für den Deutsch-Unterricht.
  2. Audio-Versionen von Arbeitsblättern für Schüler:innen mit Leseschwäche.
  3. Automatische Noten-Ansagen mit KI-Stimme.
  4. Übersetzung der Stimmen aller Elternabende.
Lösung anzeigen

Richtige Antwort: b) — Audio-Versionen von Arbeitsblättern sind eine der wertvollsten Einsatzmöglichkeiten: Schüler:innen mit Legasthenie, Sehbehinderung oder DaZ-Hintergrund profitieren davon – und die Erstellung dauert mit ElevenLabs nur wenige Minuten pro Blatt.

2. Welche Kombination ergibt das schnellste massgeschneiderte Hörverstehen-Material?

  1. ChatGPT schreibt den Text, ElevenLabs vertont ihn, Muttersprachler:in gegenhört.
  2. ElevenLabs allein, ohne weitere Tools.
  3. Lehrbuch abtippen und ElevenLabs vertonen.
  4. Schüler:innen sprechen selbst ein und ElevenLabs klont ihre Stimmen.
Lösung anzeigen

Richtige Antwort: a) — Die effektive Kombination: KI-Textwerkzeug (ChatGPT/Claude) für den Text auf passendem Niveau, ElevenLabs für die Vertonung. Ein kurzes Gegenhören durch Muttersprachler:in oder sorgfältige Eigenkontrolle sichert die Qualität – besonders bei fremdsprachlichem Material.

3. Welches Vorgehen ist beim Einsatz von KI-Audio im Unterricht Pflicht?

  1. Nur die Lehrperson darf das Audio hören.
  2. Das Material muss ausgedruckt werden.
  3. Transparente Kennzeichnung: Schüler:innen wissen, dass es KI-generiert ist.
  4. Das Audio muss an die Schulleitung gemeldet werden.
Lösung anzeigen

Richtige Antwort: c) — Transparenz ist Pflicht – sowohl ethisch als auch zunehmend rechtlich. Schüler:innen haben das Recht zu wissen, ob sie eine menschliche oder eine KI-Stimme hören. Ein kurzer Hinweis am Anfang des Audios oder auf dem Arbeitsblatt reicht aus.