- Registriert
- 01.11.16
- Beiträge
- 15.030
Jan Gruber
Apple hat in der Welt der Künstlichen Intelligenz (KI) einen bedeutenden Durchbruch erzielt und das KI-Modell MGIE ("MLLM-Guided Image Editing") veröffentlicht. Dieses innovative Tool ermöglicht die Bearbeitung und Manipulation von Bildern durch einfache Texteingaben. Im Gegensatz zu bisherigen KI-Anwendungen zur Bilderzeugung konzentriert sich MGIE darauf, bestehende Fotos nach den Wünschen der Nutzer:innen zu verändern.
Was ist MGIE?
MGIE, kurz für "MLLM-Guided Image Editing", nutzt multimodale große Sprachmodelle (MLLMs), um Anfragen in natürlicher Sprache zu verstehen und entsprechende Bildmanipulationen auf Pixelebene durchzuführen. Das bedeutet, dass Nutzer:innen Anweisungen wie "Mach den Himmel heller" oder "Entferne den Weihnachtsbaum hinter den Personen" geben können, und MGIE führt diese Anforderungen präzise aus.
Open Source für breite Nutzung
Apple hat MGIE als Open-Source-Projekt veröffentlicht, wodurch Entwickler:innen und Forscher:innen auf der ganzen Welt Zugang zu diesem fortschrittlichen Tool haben. Die Zusammenarbeit mit der University of California, Santa Barbara, unterstreicht das Engagement für wissenschaftliche Exzellenz und den Austausch von Wissen.
Die Bedeutung von MGIE
MGIE stellt einen erheblichen Fortschritt in der KI-gesteuerten Bildbearbeitung dar. Es eröffnet neue Möglichkeiten für die Bearbeitung von Fotos und Grafiken, von einfachen Farbanpassungen bis hin zu komplexen inhaltlichen Änderungen.
Mögliche Anwendungen und Zukunftsaussichten
Obwohl unklar bleibt, ob und wann MGIE in Apple-Produkten wie der Fotos-App integriert wird, ist das Potenzial dieser Technologie immens. Es könnte nicht nur die Art und Weise verändern, wie professionelle Grafiker:innen und Fotograf:innen arbeiten, sondern auch alltäglichen Nutzer:innen ermöglichen, ihre Fotos mit unvergleichlicher Leichtigkeit und Präzision zu bearbeiten.
Ein Blick in die Zukunft
Mit MGIE und der fortlaufenden Forschung in KI-Technologien, einschließlich der Entwicklung eines "Apple GPT"-Rivalen, bekräftigt Apple seine Führungsposition im Bereich der künstlichen Intelligenz. Die mögliche Integration von generativer KI-Funktionalität in zukünftige Versionen von iOS deutet auf spannende Zeiten für Apple-Nutzer:innen hin, mit potenziellen Neuerungen, die das "größte" Software-Update in der Geschichte des iPhones darstellen könnten.
Via Github
Den Artikel im Magazin lesen.