Meta steht erneut im Zentrum einer Kontroverse um künstliche Intelligenz. Der Vorwurf: Das Unternehmen soll piratisierte Inhalte aus Torrents verwendet haben, um sein Sprachmodell Llama zu trainieren. Diese Anschuldigung hat eine Welle von rechtlichen und ethischen Diskussionen ausgelöst.
Gerichtsdokumente enthüllen brisante Details
Laut einem Bericht von Wired reichte 2023 eine Gruppe von Autor:innen, darunter Richard Kadrey und Christopher Golden, eine Klage gegen Meta ein. Die Kläger:innen behaupten, dass Meta urheberrechtlich geschützte Inhalte ohne Erlaubnis genutzt habe. Bis vor kurzem lagen dem Gericht nur geschwärzte Dokumente vor. Nun hat Richter Vince Chhabria die Veröffentlichung unzensierter Unterlagen angeordnet.
Diese Dokumente zeigen interne Gespräche zwischen Meta-Mitarbeitenden. In einer Unterhaltung äußert ein Ingenieur Bedenken über das Torrenting von einer Meta-eigenen Arbeitsumgebung aus. Ein weiterer Hinweis deutet darauf hin, dass Meta-CEO Mark Zuckerberg selbst die Nutzung von urheberrechtlich geschütztem Material genehmigt haben könnte.
Besonders brisant: Die Beweise legen nahe, dass Meta Inhalte aus LibGen, einer riesigen Bibliothek piratisierter Bücher und Artikel, verwendet hat. Diese Plattform steht seit Jahren im Fokus von Copyright-Klagen und gilt als zentrale Anlaufstelle für illegale digitale Inhalte.
Metas Verteidigung: „Fair Use“ als rechtliche Grundlage
Meta beruft sich auf das Prinzip des „Fair Use“, das in bestimmten Fällen die Nutzung urheberrechtlich geschützter Inhalte ohne Genehmigung erlaubt. Das Unternehmen argumentiert, dass Llama lediglich Texte verwendet, um Sprache statistisch zu modellieren und eigene Inhalte zu generieren. Kritiker:innen zweifeln jedoch an, ob diese Argumentation vor Gericht Bestand haben wird.
Wie positioniert sich Apple?
Meta ist nicht allein. Auch andere Tech-Unternehmen sahen sich ähnlichen Vorwürfen ausgesetzt. 2024 wurde bekannt, dass Apple bei einem Forschungsprojekt für OpenELM, ein quelloffenes KI-Modell, Untertitel von über 170.000 YouTube-Videos genutzt hat. Apple stellte jedoch klar, dass dieses Modell nicht mit Apple Intelligence verbunden ist und keine urheberrechtlich geschützten Daten in seiner KI verwendet werden.
Im Gegensatz zu Meta betont Apple, dass seine KI ausschließlich mit lizenzierten und öffentlich zugänglichen Daten trainiert wird. Trotzdem bleibt der Umgang mit Trainingsdaten ein heikles Thema, da viele Verlage, wie The New York Times, eine Zusammenarbeit mit Apple verweigern.
Fazit
Die Vorwürfe gegen Meta werfen ein Schlaglicht auf die Grauzonen beim Training moderner KI-Modelle. Während Unternehmen wie Meta auf „Fair Use“ pochen, zeigt der Fall, wie wichtig klare ethische und rechtliche Standards in der KI-Entwicklung sind.
Via: 9To5Mac