• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Was gibt es Schöneres als den Mai draußen in der Natur mit allen Sinnen zu genießen? Lasst uns teilhaben an Euren Erlebnissen und macht mit beim Thema des Monats Da blüht uns was! ---> Klick

Jan Gruber

Chefredakteur Magazin und Podcasts
AT Administration
AT Redaktion
Registriert
01.11.16
Beiträge
14.835
Llama-2-700x400.jpg


Jan Gruber
Meta hat diese Woche wenig überraschend Code Llama veröffentlicht, eine AI die euch beim Programmieren helfen soll.

Meta hat ein neues KI-Modell namens "Code Llama" vorgestellt, das auf dem Llama-2-Modell basiert. Dieses Modell wurde in Zusammenarbeit mit Microsoft entwickelt und soll die Code-Generierung revolutionieren. Aber was macht es so besonders? Lass uns eintauchen.

Was kann Code Llama?​


Code Llama ist nicht nur ein weiteres KI-Modell. Es kann Code generieren und natürliche Sprache über Code verstehen. Du kannst es sogar bitten, dir eine Funktion zu schreiben, die die Fibonacci-Folge ausgibt. Aber das ist noch nicht alles. Es kann auch für Code-Vervollständigung und Debugging verwendet werden. Es unterstützt eine Vielzahl von Programmiersprachen, darunter Python, C++, Java, PHP, TypeScript, C# und Bash.

Drei Versionen für unterschiedliche Bedürfnisse​


Meta hat drei Versionen von Code Llama veröffentlicht, die jeweils 7 Milliarden, 13 Milliarden und 34 Milliarden Parameter haben. Die 7-Milliarden- und 13-Milliarden-Versionen sind besonders gut in der Code-Vervollständigung. Sie wurden mit "Fill-in-the-middle (FIM)"-Daten trainiert. Das kleinste Modell kann sogar auf einer einzigen GPU laufen.

Spezialisierte Versionen und Verfügbarkeit​


Neben den allgemeinen Versionen hat Meta auch spezialisierte Versionen veröffentlicht. Eine davon ist eine Python-Version, die mit zusätzlichen 100 Milliarden Parametern trainiert wurde. Ein weiteres Modell, das Instruct-Modell, kann auf Anweisungen wie ChatGPT reagieren und ebenfalls Code vervollständigen. Der Code für diese Modelle wurde auf GitHub veröffentlicht und ist sowohl für die Forschung als auch für die kommerzielle Nutzung frei verfügbar.

Via Meta Blog

Den Artikel im Magazin lesen.