Einrichtung und erste Schritte
Was ElevenLabs ist, wie du ein Konto erstellst und deine erste Sprachausgabe generierst
ElevenLabs ist ein KI-Tool für hochwertige Sprachsynthese. Du gibst Text ein – ElevenLabs macht daraus eine natürlich klingende Audiodatei. Auf Deutsch, Englisch, Französisch und in über 30 weiteren Sprachen.
Was es besonders gut kann:
- Natürliche Stimmen – Intonation, Pausen und Betonungen wirken nicht mehr roboterhaft.
- Voice-Cloning – deine eigene Stimme in 1–3 Minuten klonen.
- Mehrsprachigkeit – eine geklonte Stimme spricht automatisch 30+ Sprachen.
- Feinsteuerung – Geschwindigkeit, Stabilität, Emotionalität einstellbar.
Abgrenzung zu NotebookLM Audio Overview:
- NotebookLM Audio Overview: Erstellt aus deinen Quellen einen Podcast-Dialog – zwei KI-Stimmen unterhalten sich.
- ElevenLabs: Erstellt aus deinem eigenen Text eine klare Erzähl-Stimme. Du steuerst jedes Wort.
Kurz gesagt: NotebookLM für den Podcast-Einstieg, ElevenLabs für kontrollierte Audioausgaben (Hörverstehen, Erklärvideos, Arbeitsblatt-Audio).

ElevenLabs hat ein grosszügiges Gratis-Kontingent. Perfekt zum Ausprobieren.
Registrierung in 3 Schritten:
- Gehe auf elevenlabs.io und klicke oben rechts auf «Sign Up».
- Registriere dich mit Google-Konto oder E-Mail.
- Bestätige die E-Mail – du landest direkt im Studio.
Free-Tier (Stand 2026):
- 10 000 Zeichen pro Monat – etwa 10 Minuten generiertes Audio mit Multilingual v2.
- Zugriff auf alle Standard-Stimmen aus der Voice Library.
- Kein Voice Cloning (das gibt's erst ab Starter).
- Kommerzielle Nutzung nicht erlaubt – für den eigenen Unterricht aber unproblematisch.
Bezahl-Tiers (wenn du Voice Cloning brauchst oder das Free-Tier nicht reicht):
- Starter (ca. 5 $/Monat): 30 000 Zeichen, Instant Voice Cloning (bis 10 eigene Stimmen), kommerzielle Lizenz.
- Creator (ca. 22 $/Monat): 100 000 Zeichen, Professional Voice Clone.
Für einzelne Lehrpersonen reicht das Free-Tier fast immer. Teste es zuerst gründlich aus, bevor du etwas zahlst.

Nach dem Login landest du im Dashboard. Die wichtigsten Bereiche in der linken Seitenleiste:
Text to Speech:
- Das Herzstück: Text eingeben, Stimme wählen, Audio generieren.
- Ideal für kurze Texte (bis ca. 5000 Zeichen pro Generierung).
Studio:
- Editor für längere Audioprojekte (Hörbücher, mehrteilige Lektionen) mit Kapitelstruktur und Sprecherwechsel.
Voices:
- Deine persönliche Stimmensammlung – Favoriten aus der Voice Library, eigene Klonungen.
Voice Library:
- Riesige Sammlung von Community-Stimmen (Tausende, nach Sprache/Alter/Akzent filterbar).
- Stimmen mit einem Klick in deine persönliche Sammlung übernehmen.
Dubbing:
- Videos automatisch in andere Sprachen synchronisieren (inklusive Lippensynchronisation).
Für den Einstieg reicht Text to Speech vollkommen. Alles andere lernst du später kennen.

Jetzt generierst du deine erste Audiodatei. Ziel: ein kurzer deutscher Begrüssungstext.
Schritt für Schritt:
- Klicke in der Seitenleiste auf «Studio».
- Wähle oben rechts eine deutsche Stimme (z.B. «Liam» oder «Charlotte» – beide mehrsprachig).
- Stelle das Modell auf «Eleven Multilingual v2» – eine verlässliche Wahl für Deutsch. Falls in deinem Konto verfügbar: v3 (alpha) klingt bei Deutsch oft noch natürlicher.
- Gib in das grosse Textfeld ein: «Guten Morgen, liebe Klasse! Heute beschäftigen wir uns mit einem spannenden Thema: der Fotosynthese. Seid ihr bereit?»
- Klicke unten auf «Generate».
- Nach wenigen Sekunden erscheint ein Audio-Player. Probehören – bei Bedarf nachjustieren.
- Mit dem Download-Button (↓) speicherst du die MP3 auf deinem Gerät.
Fertig – deine erste KI-Sprachausgabe.

Quiz
1. Was ist der Hauptunterschied zwischen ElevenLabs und NotebookLMs Audio Overview?
- ElevenLabs ist kostenpflichtig, NotebookLM gratis.
- ElevenLabs erstellt eine klare Erzählstimme aus deinem Text, NotebookLM generiert einen Dialog aus Quellen.
- ElevenLabs funktioniert nur auf Englisch.
- NotebookLM ist präziser bei Fachbegriffen.
Lösung anzeigen
Richtige Antwort: b) — ElevenLabs nimmt deinen eigenen Text und macht daraus eine kontrollierte Erzählstimme – du bestimmst jedes Wort. NotebookLM erstellt einen automatischen Dialog zwischen zwei KI-Stimmen aus deinen Quellen. Für Hörverstehen-Material eignet sich ElevenLabs besser, für Einstiegs-Podcasts NotebookLM.
2. Wie viel Audio kannst du im Free-Tier pro Monat generieren?
- Unbegrenzt.
- Etwa 1 Minute.
- Etwa 10 Minuten (10 000 Zeichen).
- Etwa 60 Minuten.
Lösung anzeigen
Richtige Antwort: c) — Das Free-Tier bietet 10 000 Zeichen pro Monat – das entspricht etwa 10 Minuten gesprochenem Audio. Genug für 2–3 Hörverstehen-Aufgaben oder ein kurzes Erklärvideo.
3. Welches Modell solltest du für deutsche Texte wählen?
- Eleven English v1 – das Originalmodell.
- Eleven Multilingual v2 oder v3 – natürliche Qualität für Deutsch.
- Eleven Turbo v2.5 oder Flash v2.5 – das schnellste Modell.
- Es spielt keine Rolle, alle Modelle sind gleich.
Lösung anzeigen
Richtige Antwort: b) — «Multilingual v2» (oder v3, falls verfügbar) ist auf Mehrsprachigkeit optimiert und klingt bei Deutsch natürlich. Turbo v2.5 und Flash v2.5 sind schneller, bei Deutsch aber meist weniger ausdrucksstark – für Unterrichtsmaterialien lohnt sich die bessere Qualität.