Grosse Sprachmodelle lernen aus «Büchern», indem sie Texte in kleine Einheiten, sogenannte Tokens, zerlegen. Diese Modelle achten genau darauf, was links und rechts von jedem Wort steht und erstellen für jedes Wort riesige Vektoren. Diese Vektoren enthalten alle möglichen Wahrscheinlichkeiten der Wörter, die in der Nachbarschaft auftauchen können, wodurch die Modelle das Zusammenspiel der Wörter «verstehen».

Let’s dive in…

Ohne zu sehr ins Detail zu gehen, möchte ich doch einiges dazu erklären, wie man mit Wörtern Berechnungen anstellt und Vorhersagen treffen kann.

Zunächst wird ein Textblock aus dem Lernmaterial in Tokens zerlegt. Um die Bedeutung eines Wortes zu erfassen, beobachten LLMs diese Trainingsdaten und beachten die umliegenden Wörter. Das Modell verarbeitet diese Wörter und erstellt einen Vektor, bekannt als «Word Embedding», der auf der Nähe der Wörter in den Trainingsdaten basiert. Ein Word Embedding kann Hunderte Werte haben, wobei jeder Wert einen anderen Aspekt der Bedeutung eines Wortes repräsentiert. Genauso wie du ein Haus anhand seiner Merkmale beschreibst – Typ, Standort, Schlafzimmer, Badezimmer, Stockwerke –, quantifizieren die Werte in einem Embedding die sprachlichen Eigenschaften eines Wortes.

Die Art und Weise, wie diese Charakteristika abgeleitet werden, bedeutet, dass wir nicht genau wissen, was jeder Wert darstellt. Aber Wörter, von denen wir erwarten, dass sie auf vergleichbare Weise verwendet werden, haben oft ähnlich aussehende Embeddings. Im nachfolgenden Beispiel sieht man, dass die Wörter «Sea» und «Ocean» sowie «football» und «soccer» oder «I» und «we» sehr ähnliche «Word Embeddings» haben.

Hier geht es zum gesamten Artikel: Mit Wörtern rechnen: AI & LLMs für Entscheidungsträger

Über die BitHawk AG

Die BitHawk AG beschäftigt rund 230 Mitarbeitende. Der Hauptsitz von BitHawk ist in Sursee, weitere Standorte befinden sich in Basel und Winterthur.

Die Kernkompetenzen der BitHawk liegen in den Bereichen Consulting, Engineering und Operations von IT-Infrastrukturen sowie in IT- und Enterprise Service Management Lösungen. Das Lösungsportfolio umfasst die Themen Netzwerk, Unified Communications und Collaboration, Unified Computing, Workplace und Public- Hybrid und Privat Clouds . Speziallösungen wie IT- Security und Digital Signage Solution runden das Portfolio ab. Qualifizierte Spezialisten beraten Kunden im Hinblick auf eine langfristig sinnvolle und anpassungsfähige IT-Umgebung. Ein umfassender Service Desk, ein eigenes Rechenzentrum und Repair Center garantieren höchste Verfügbarkeit und schnelle Reaktionszeiten.

Firmenkontakt und Herausgeber der Meldung:

BitHawk AG
Allee 1A
CH6210 Sursee
Telefon: +41 (58) 2260101
Telefax: +41 (58) 22600-50
http://www.bithawk.ch

Ansprechpartner:
Roland Marti
Head of Marketing
Telefon: +41 (58) 2260838
E-Mail: marketing@bithawk.ch
Für die oben stehende Story ist allein der jeweils angegebene Herausgeber (siehe Firmenkontakt oben) verantwortlich. Dieser ist in der Regel auch Urheber des Pressetextes, sowie der angehängten Bild-, Ton-, Video-, Medien- und Informationsmaterialien. Die United News Network GmbH übernimmt keine Haftung für die Korrektheit oder Vollständigkeit der dargestellten Meldung. Auch bei Übertragungsfehlern oder anderen Störungen haftet sie nur im Fall von Vorsatz oder grober Fahrlässigkeit. Die Nutzung von hier archivierten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die United News Network GmbH gestattet.

counterpixel