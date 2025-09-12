1) Was sagt die EU-AI-Verordnung (AI-Act) zur Kennzeichnung/Transparenz?

Die EU-AI-Verordnung (veröffentlicht im Amtsblatt 12.7.2024) enthält in Kapitel IV spezielle Transparenzpflichten für Anbieter und Deployende bestimmter KI-Systeme: Insbesondere müssen Systeme, die direkt mit natürlichen Personen interagieren, so gestaltet sein, dass die Betroffenen darüber informiert werden, dass sie mit einer künstlichen Intelligenz interagieren (es sei denn, das ist aus dem Kontext offensichtlich). Außerdem sind Outputs, die synthetische Inhalte (z. B. Deepfakes) darstellen oder Inhalte zu öffentlichen Angelegenheiten liefern, besonders zu kennzeichnen; die Verordnung sieht ferner Pflichten zur Information über Eigenschaften und Grenzen von Systemen vor.

Was bedeutet das praktisch? Die Verordnung verlangt oft eine Kennzeichnung (z. B. „Dieses Ergebnis wurde von einer KI erzeugt“). Sie verlangt aber nicht ausdrücklich für jede Textantwort eine vollständige Quellenbibliografie der Trainingsdaten oder aller verwendeten Textzeilen. Entscheidend ist, ob es um die bloße Kennzeichnung von KI-Erzeugung geht oder um inhaltliche Quellenangaben — das sind rechtlich unterschiedliche Pflichten.

2) Bedeutet das Kennzeichnen automatisch eine Pflicht zur Quellenangabe (z. B. Literaturverzeichnis)?

Nein — Kennzeichnungspflicht ≠ Quellenverpflichtung. Die EU-Verordnung verlangt Information darüber, dass ein Inhalt KI-generiert ist; sie verlangt jedoch nicht generell, dass die KI jeden einzelnen Trainingsdatensatz oder die exakte Herkunft einer einzelnen Aussage offenlegt. Die Verordnung kann aber (und wird) in bestimmten Fällen ergänzende Transparenzmaßnahmen verlangen; die Details werden durch Leitlinien, Implementierungsakte und Good-Practice-Dokumente konkretisiert.

3) Welche Rolle spielt das deutsche Urheberrecht (UrhG) bei Quellenangaben?

Das Urheberrechtsgesetz schützt Werke — Texte, Bilder, Musik usw. — und regelt, wann die Verwendung fremder Werke zulässig ist. Wenn eine KI Inhalte wiederverwendet, die urheberrechtlich geschützt sind (z. B. ganze Absätze oder Bilder), können Urheberrechte verletzt werden. Quellenangabe allein befreit nicht automatisch von einer Urheberrechtsverletzung: Urheberrechtliche Nutzungs- und Verwertungsrechte müssen eingeholt oder eine gesetzliche Schranke (z. B. Zitatrecht) prüfen werden.

Praxisbeispiele: 1) Eine KI kopiert ohne Anpassung einen geschützten Artikel — Quellenangabe hilft moralisch, kann aber die rechtliche Nutzungsbefugnis nicht ersetzen. 2) Eine KI paraphrasiert Inhalte: Hier ist die Prüfung möglich, ob es sich noch um zulässige freie Verwendung oder bereits um eine Urheberrechtsverletzung handelt. 3) Für das Training verwendete Werke: Aktuell gibt es Diskussionen und teilweise konkrete Verpflichtungen zur Transparenz über Trainingsdaten, um Rechteinhabern die Durchsetzung ihrer Ansprüche zu ermöglichen; die EU-Regelungen und nationale Umsetzungen treiben hier Änderungen voran.

4) Welche datenschutzrechtlichen (DSGVO) Aspekte spielen eine Rolle?

Wenn eine KI personenbezogene Daten verarbeitet (z. B. Inhalte über identifizierte oder identifizierbare Personen), greifen die Informationspflichten der DSGVO: Art. 13/14 DSGVO verlangt, dass betroffene Personen beim Erheben oder wenn Daten nicht direkt beim Betroffenen erhoben wurden, informiert werden. Das umfasst Zwecke, Rechtsgrundlagen, Empfänger und — im Umfang, der praktikabel ist — Informationen über automatisierte Entscheidungsfindung und die Logik der Verarbeitung. Bei KI-Systemen bedeutet das: Es kann notwendig sein, Betroffene darüber zu informieren, dass Systeme mit ihren Daten trainiert wurden oder dass eine automatisierte Verarbeitung stattfindet.

5) Gibt es bereits Pflichten gegenüber Rechteinhabern bezüglich Trainingsdaten?

Es gibt eine deutliche Entwicklung in diese Richtung: EU-Regelungen und nationale Initiativen zielen darauf ab, mehr Transparenz über Trainingsdaten zu schaffen, damit Rechteinhaber Verletzungen prüfen können. Die konkrete Ausgestaltung (z. B. Umfang der Offenlegung, Form) ist teilweise noch offen und wird durch Delegierte/Implementing Acts, Leitlinien und Gerichtsurteile konkretisiert. Die Gesetzeslage verlangt zunehmend Dokumentation über Trainingsdaten und deren Herkunft — insbesondere für große Sprachmodelle und allgemeine Modelle.

6) Welche Risiken drohen, wenn keine Quellen offengelegt werden?

Urheberrechtsverletzungen (Unterlassung, Schadensersatz).

(Unterlassung, Schadensersatz). Irreführung / Verbraucherschutzverletzungen (wenn Inhalte als belegte Fakten präsentiert werden).

(wenn Inhalte als belegte Fakten präsentiert werden). Datenschutzverstöße , wenn personenbezogene Daten ohne rechtliche Grundlage verarbeitet oder nicht hinreichend offengelegt werden.

, wenn personenbezogene Daten ohne rechtliche Grundlage verarbeitet oder nicht hinreichend offengelegt werden. Reputations- und Vertragsrisiken (z. B. wenn ein Unternehmen falsche Aussagen publiziert oder Dritte geschädigt werden).

Viele dieser Risiken lassen sich durch transparente Prozesse, Mensch-in-der-Schleife-Prüfung und konservative Attribution reduzieren. :contentReference[oaicite:8]{index=8}

7) Was heißt das konkret für Anbieter von KI (Provider) — welche Pflichten haben sie?

Provider müssen eine Reihe von technischen und organisatorischen Maßnahmen einführen: Dokumentation, Risikoassessment, Angaben darüber, dass es sich um KI handelt (wenn erforderlich), Sicherheits- und Robustheitsmaßnahmen, und (je nach System) erweiterte Transparenz gegenüber Nutzer*innen und Behörden. Für General-Purpose AI gibt es zusätzliche Anforderungen (z. B. Bereitstellung von Informationen, Protokollierung). Viele dieser Pflichten ergeben sich direkt aus der EU-AI-Verordnung; die nationalen Behörden veröffentlichen ergänzende Guidance.

8) Was heißt das konkret für Nutzer (Journalist, Blogger, Firma, Privatperson)?

Kennzeichnen: Wenn Sie ein Ergebnis unverändert verwenden und es erkennbar KI-generiert ist, deklarieren Sie es als solches (z. B. „Erstellt mit KI-Modell X“). Quellenprüfung: Verifizieren Sie kritische Fakten durch unabhängige, zitierfähige Quellen, bevor Sie sie publizieren. Dokumentation: Halten Sie fest, welches System, welches Prompting und welche Nachbearbeitung Sie verwendet haben (Nachweis bei Streit). Urheberrecht prüfen: Wenn die KI Inhalte produziert, die ersichtlich auf geschützten Werken beruhen, lassen Sie die Rechtslage prüfen.

Diese Maßnahmen verringern rechtliche Risiken und erhöhen die Glaubwürdigkeit.

9) Warum es problematisch sein kann, eine allgemeine Quellenpflicht für KI einzuführen

Das ist die konträre Perspektive: eine verpflichtende, vollständige Quellenangabe pro KI-Antwort klingt aus Sicht des Verbraucherschutzes gut — in der Praxis aber problematisch:

Skalierungsproblem: Große Modelle sind mit Milliarden von Textfragmenten trainiert; eine lückenlose Angabe wäre technisch und ökonomisch kaum realisierbar.

Große Modelle sind mit Milliarden von Textfragmenten trainiert; eine lückenlose Angabe wäre technisch und ökonomisch kaum realisierbar. Geschäftsgeheimnisse / IP: Anbieter möchten nicht ihre Trainingskorpora offenlegen, weil das Wettbewerbswissen und Vertragsdaten betreffen kann.

Anbieter möchten nicht ihre Trainingskorpora offenlegen, weil das Wettbewerbswissen und Vertragsdaten betreffen kann. Unscharfe Attribution: Modelle generieren oft eine statistische Verallgemeinerung — die „Quelle“ ist nicht immer ein einzelner Satz aus einem Werk.

Modelle generieren oft eine statistische Verallgemeinerung — die „Quelle“ ist nicht immer ein einzelner Satz aus einem Werk. Falsche Sicherheit: Eine Quellenliste könnte den Nutzer fälschlich beruhigen, auch wenn die generierte Aussage falsch bleibt.

Diese Gegenargumente erklären, warum Gesetzgebung und Regulierung oft pragmatische, gestufte Transparenzregeln vorsehen, statt einer absolutistischen Quellenpflicht. Trotzdem lässt sich viel erreichen: z. B. bessere Metadaten, „model cards“, provenance-Metadaten für signifikante Verwendungen und besondere Regeln für Inhalte von öffentlichem Interesse.

10) Drei konkrete, praxisnahe Handlungsanweisungen

Für Inhaltsersteller (z. B. Redaktionen, Blogger): Wenn Sie KI-Texte verwenden, fügen Sie sichtbar hinzu: „(Teilweise) erzeugt mit KI-System [Name/Version]. Fakten geprüft am [Datum] anhand [Quelle(n)].“ Sichern Sie die Prüfprotokolle (Screenshots, Links). — Warum: reduziert Irreführungsrisiko und erfüllt die Aussagepflichten der AI-Verordnung in der Praxis. Für Unternehmen/Provider: Implementieren Sie ein Trainingsdaten-Register (mindestens Metadaten: Herkunftsquelle, Lizenzstatus, Datum, Snapshot). Führen Sie ein Compliance-Register mit Entscheidungen zu Urheberrechts- und Datenschutzfragen. — Warum: erleichtert Nachvollziehbarkeit, Reaktion auf Anfragen und Behördenprüfungen. Für Betroffene / Privatpersonen: Fordern Sie bei Zweifeln erkennbare Quellen oder eine Erklärung an, wenn ein Dienst Sie mit automatischer Entscheidungsunterstützung beeinflusst (soweit relevant nach DSGVO). Dokumentieren Sie Fehler und sammeln Sie Beispiele (Datum, Text, Kontext). — Warum: Nützlich für Beschwerden oder rechtliche Schritte.

11) Drei Beispiele, wie Gesetze angewandt werden

Beispiel A — Nachrichtenmedium nutzt KI für Artikel über politische Themen Situation: Ein Online-Medium veröffentlicht Artikel, die zum Teil von einer generativen KI verfasst wurden und behandelt öffentliche Angelegenheiten. Anwendung: Nach Art. 50 AI-Act muss die Herkunft (KI-generiert) offen gelegt werden; bei öffentlichen Angelegenheiten ist eine Kennzeichnung besonders relevant. Zusätzlich muss die Redaktion Quellen prüfen (journalistische Sorgfalt) — und bei der Nutzung fremder urheberrechtlich geschützter Texte sind Nutzungsrechte zu klären. Ein Medium, das das nicht tut, riskiert Sanktionen nach der AI-Verordnung und mögliche Urheberrechtsansprüche. Beispiel B — Unternehmen trainiert internes Modell mit Dritten-Content Situation: Ein Unternehmen stellt ein Modell bereit, das mit externen Webtexten trainiert wurde. Anwendung: Rechteinhaber können Ansprüche geltend machen, wenn urheberrechtlich geschützte Inhalte ohne Lizenz verwendet wurden; Provider müssen die Dokumentations- und Transparenzpflichten der AI-Verordnung erfüllen und datenschutzrechtliche Vorgaben umsetzen, falls personenbezogene Daten im Training enthalten sind. Anbieter sollten ein Trainingsdaten-Register und Prozesse zur Lizenzprüfung vorweisen können. Beispiel C — Nutzung einer KI zur automatisierten Bewerber-Selektion Situation: Eine Personalabteilung nutzt ein KI-Tool zur Vorauswahl. Anwendung: Hier greifen hohe Anforderungen (AI-Act: High-Risk) und DSGVO (automatisierte Entscheidungsfindung). Betroffene müssen über die Nutzung informiert werden; es bestehen Rechenschaftspflichten, Nachvollziehbarkeit und ggf. das Recht auf menschliche Intervention. Quellenangaben für einzelne Fakten sind weniger das Thema — vielmehr geht es um die Dokumentation der Merkmale, Datenherkunft und Modelllogik.

12) Mögliche Hindernisse

Hindernis Warum relevant Was unklar ist / zu klären Rechtsgrundlage / Ansatz Konkreter To-Do-Schritt Unklare Herkunft von Trainingsdaten Ohne Herkunftsangaben können Rechteinhaber Ansprüche stellen; Beweisprobleme. Welche Daten stammen von Dritten? Welche Lizenzen bestehen? UrhG, AI-Verordnung (Dokumentationspflichten). Erstellen Sie ein Metadaten-Register; fordern Sie vom Provider Dataset-Metadaten an. Skalierbarkeit der Quellenangabe Technische Unmöglichkeit, Millionen Quellen pro Antwort anzugeben. Welche Minimalauskunft ist praktikabel und rechtlich ausreichend? AI-Verordnung: gestufte Transparenz; Leitlinien des AI-Office. Implementieren Sie „provenance tags“ für kritische Antworten; definieren Sie Schwellenwerte. Geschäftsgeheimnisse / IP Provider wollen interne Korpora schützen. Wie kann Transparenz erfolgen, ohne Geschäftsgeheimnisse preiszugeben? Handelsrecht, Geheimnisschutz vs. Durchsetzungsinteressen Dritter. Verhandeln Sie eingeschränkte Offenlegung (Audit-Zugänge für Aufsichtsbehörden / unabhängige Prüfer). Datenschutz (personenbezogene Trainingsdaten) Verarbeitung personenbezogener Daten kann illegal sein. Wurden personenbezogene Daten rechtmäßig erhoben/ verarbeitet? DSGVO Art. 13/14, Art. 22 (automatisierte Entscheidungen) Datenschutz-Auswirkungsanalyse (DPIA) durchführen; Lösch-/Anonymisierungsprozesse prüfen. Irreführung von Nutzern Fehlende Quellen/ Kennzeichnung kann Vertrauen zerstören, Abmahnungen auslösen. Wie ist die Nutzererwartung? Handelt es sich um redaktionelle Inhalte? Wettbewerbsrecht (UWG), Verbraucherschutz; AI-Verordnung Klare Kennzeichnungen einführen; redaktionelle Review-Prozesse.

13) Geprüfte Links auf Gesetze und offizielle Texte (Direktlinks)

EU Artificial Intelligence Act — Amtsblatt (offizieller Verordnungstext, PDF). (Regulation (EU) 2024/1689). — https://eur-lex.europa.eu/eli/reg/2024/1689/oj .

. EU-AI-Act — Kapitel / Article 50 (Transparenzpflichten) (siehe Seiten des Amtsblatts/PDF). — (siehe oben, PDF).

Urheberrechtsgesetz (UrhG) — konsolidierter Text (gesetze-im-internet.de). — https://www.gesetze-im-internet.de/urhg/ .

. DSGVO — offizieller Text (EUR-Lex / PDF). — https://eur-lex.europa.eu/eli/reg/2016/679/oj .

. Bundesministerium der Justiz: FAQ / Informationen zu KI und Urheberrecht (BMJV-Publikation). — BMJV: KI & Urheberrecht (FAQ, PDF) .

14) Wichtige Stichworte für Sie im Überblick

Kennzeichnungspflicht: Die Pflicht, Nutzerinnen und Nutzer zu informieren, dass sie mit einer KI interagieren oder Inhalte KI-generiert sind (zentrale Anforderung der EU-AI-Verordnung).

Die Pflicht, Nutzerinnen und Nutzer zu informieren, dass sie mit einer KI interagieren oder Inhalte KI-generiert sind (zentrale Anforderung der EU-AI-Verordnung). Quellenangabe: Konkrete Nennung von Herkunft (Autor, Werk, URL). Rechtlich relevant vor allem bei urheberrechtlich geschütztem Material und bei wissenschaftlicher/öffentlicher Kommunikation.

Konkrete Nennung von Herkunft (Autor, Werk, URL). Rechtlich relevant vor allem bei urheberrechtlich geschütztem Material und bei wissenschaftlicher/öffentlicher Kommunikation. Transparenzpflicht: Breiterer Begriff: umfasst Kennzeichnung, Offenlegung von Beschränkungen, Trainingsdaten-Metadaten oder Modellinterpretationen.

Breiterer Begriff: umfasst Kennzeichnung, Offenlegung von Beschränkungen, Trainingsdaten-Metadaten oder Modellinterpretationen. Urheberrecht (UrhG): Regelt Schutz von Werken — Schutz kann Nutzung ohne Lizenz verbieten (siehe §1 ff. UrhG).

Regelt Schutz von Werken — Schutz kann Nutzung ohne Lizenz verbieten (siehe §1 ff. UrhG). DSGVO: Vorschriften zum Schutz personenbezogener Daten; Informationspflichten (Art. 13/14) gelten auch bei KI-Verarbeitung.

Vorschriften zum Schutz personenbezogener Daten; Informationspflichten (Art. 13/14) gelten auch bei KI-Verarbeitung. advocatus diaboli: Die konträre Analyse — wichtig, weil sie zeigt, warum starre Pflichten praktisch schwer sind.

15) Drei konkrete Checklisten (Kurzform) — für Redaktionen, Unternehmen, Privatpersonen

Checkliste: Redaktion / Content Creator KI-Erzeugung sichtbar kennzeichnen.

Für journalistisch relevante Aussagen unabhängige Quellen prüfen & angeben.

Vermerke über verwendetes Modell, Datum, Prompts aufbewahren. Checkliste: Unternehmen / Provider Trainingsdaten-Metadaten anlegen (Quelle, Lizenzstatus, Zeitpunkt).

DPIA (Datenschutz-Folgenabschätzung) durchführen, wenn personenbezogene Daten betroffen sind.

Transparenz- und Risikoberichte erstellen; Ansprechpartner benennen. Checkliste: Privatperson / Betroffener Bei problematischen Inhalten Provider kontaktieren; Screenshots + Metadaten sichern.

Bei Datenschutzverstößen Beschwerde bei der zuständigen Aufsichtsbehörde einreichen (in DE: jeweilige DPA).

Bei Urheberrechtsverletzungen Abmahnung / Rechtsanwalt prüfen lassen.

16) Fazit

Zusammengefasst: Es besteht derzeit keine pauschale, allgemeine gesetzliche Pflicht, dass jede KI-Antwort eine vollständige literarische Quellenangabe enthalten muss. Allerdings existieren verbindliche Kennzeichnungs- und Transparenzpflichten (EU-AI-Verordnung) und ergänzende Pflichten aus Urheber- und Datenschutzrecht, die in vielen konkreten Fällen effektive Offenlegungs- oder Lizenzierungspflichten auslösen können. Praktisch sollten Anbieter, Redaktionen und Nutzer konservativ und dokumentierend handeln: KI kennzeichnen, wesentliche Quellen prüfen und dokumentieren, Trainingsdaten-Metadaten pflegen.

