Swarm
Übersicht von Swarm
Swarm: Leichtgewichtiges Multi-Agenten-Orchestrierungs-Framework
Was ist Swarm?
Swarm ist ein experimentelles, lehrreiches Framework, das von OpenAI entwickelt wurde, um ergonomische, leichtgewichtige Multi-Agenten-Orchestrierung zu erforschen. Es konzentriert sich darauf, die Agenten-Koordination und -Ausführung leichtgewichtig, hochgradig steuerbar und einfach testbar zu machen. Swarm erreicht dies durch zwei primitive Abstraktionen: Agents und Handoffs.
Hinweis: Swarm wurde durch das OpenAI Agents SDK ersetzt, das eine produktionsreife Weiterentwicklung von Swarm darstellt. Es wird empfohlen, für Produktionsanwendungsfälle zum Agents SDK zu migrieren.
Wie funktioniert Swarm?
Swarm funktioniert, indem es Agents ermöglicht, Anweisungen und Tools zu umfassen. Zu jedem Zeitpunkt kann ein Agent eine Konversation an einen anderen Agenten übergeben. Diese Primitive sind leistungsfähig genug, um reichhaltige Dynamiken zwischen Tools und Netzwerken von Agenten auszudrücken, sodass Sie skalierbare, reale Lösungen erstellen können.
Swarm Agents werden von der Chat Completions API angetrieben und sind zwischen den Aufrufen zustandslos. Die Funktion client.run()
implementiert eine Schleife, die Folgendes ausführt:
- Ruft eine Vervollständigung vom aktuellen Agenten ab.
- Führt Tool-Aufrufe aus und hängt Ergebnisse an.
- Wechselt den Agenten bei Bedarf.
- Aktualisiert Kontextvariablen bei Bedarf.
- Gibt zurück, wenn keine neuen Funktionsaufrufe erfolgen.
Warum Swarm wählen?
Swarm erforscht Muster, die von Natur aus leichtgewichtig, skalierbar und hochgradig anpassbar sind. Es eignet sich am besten für Situationen, in denen eine große Anzahl unabhängiger Fähigkeiten und Anweisungen erforderlich ist, die sich nur schwer in einen einzigen Prompt codieren lassen.
Hauptmerkmale und Konzepte
- Agents: Umfassen Anweisungen und Tools. Sie können bestimmte Workflows oder Schritte darstellen, die durch Anweisungen und Funktionen definiert sind.
- Handoffs: Agents können die Ausführung an einen anderen Agenten übergeben.
- Funktionen: Swarm Agents können Python-Funktionen direkt aufrufen. Funktionen sollten normalerweise einen String zurückgeben (Werte werden versucht, als String umgewandelt zu werden).
- Kontextvariablen: Agents können auf Kontextvariablen zugreifen und diese aktualisieren, sodass sie den Zustand verwalten und Informationen austauschen können.
- Streaming: Swarm unterstützt Streaming-Antworten und bietet Echtzeit-Updates.
Wie verwendet man Swarm?
Installation:
pip install git+ssh://git@github.com/openai/swarm.git
oder
pip install git+https://github.com/openai/swarm.git
Instanziieren Sie einen Swarm-Client:
from swarm import Swarm client = Swarm()
Definieren Sie Agents:
from swarm import Agent agent_a = Agent( name="Agent A", instructions="You are a helpful agent.", functions=[transfer_to_agent_b], ) agent_b = Agent( name="Agent B", instructions="Only speak in Haikus.", ) def transfer_to_agent_b(): return agent_b
Führen Sie den Swarm aus:
response = client.run( agent=agent_a, messages=[{"role": "user", "content": "I want to talk to agent B."}], ) print(response.messages[-1]["content"])
Für wen ist Swarm?
Swarm ist eine Bildungsressource für Entwickler, die neugierig sind, mehr über Multi-Agenten-Orchestrierung zu erfahren. Es eignet sich für diejenigen, die mit einer großen Anzahl unabhängiger Fähigkeiten und Anweisungen zu tun haben, die sich nur schwer in einen einzigen Prompt codieren lassen.
Beispiele
- basic: Einfache Beispiele für Grundlagen wie Einrichtung, Funktionsaufrufe, Handoffs und Kontextvariablen.
- triage_agent: Einfaches Beispiel für die Einrichtung eines grundlegenden Triage-Schritts zur Übergabe an den richtigen Agenten.
- weather_agent: Einfaches Beispiel für Funktionsaufrufe.
- airline: Ein Multi-Agenten-Setup zur Bearbeitung verschiedener Kundendienstanfragen im Kontext einer Fluggesellschaft.
- support_bot: Ein Kundendienst-Bot, der einen User-Interface-Agenten und einen Help-Center-Agenten mit verschiedenen Tools enthält.
- personal_shopper: Ein persönlicher Einkaufsagent, der bei Verkäufen und Rückerstattungen helfen kann.
Fazit
Obwohl Swarm vom OpenAI Agents SDK abgelöst wurde, bleibt es eine wertvolle Bildungsressource für das Verständnis der Multi-Agenten-Orchestrierung. Es bietet eine Grundlage für den Aufbau skalierbarer und anpassbarer KI-Workflows. Das Agents SDK ist eine produktionsreife Lösung für Entwickler, die ein integriertes Speicherverwaltungs- und -abrufsystem suchen und eine bedeutende Weiterentwicklung von Swarm darstellt.
Beste Alternativwerkzeuge zu "Swarm"

Aperty Portrait Photo Editor verwendet KI, um mit wenigen Klicks auf einfache Weise makellose Porträts mit natürlichen Hautbearbeitungen zu erstellen. Verfügbar als macOS- und Windows-App sowie als Plugin für Photoshop und Lightroom.

Lernen Sie Uxer kennen, Ihren KI-gestützten Automatisierungsassistenten. Automatisieren Sie Aufgaben und Arbeitsabläufe für Windows, Mac, iOS, Android und Browser mit KI-Agenten.

Installieren Sie einen kostenlosen KI-Assistenten in Ihrem Slack. Nutzen Sie das neueste ChatGPT 4o-Modell kostenlos und unbegrenzt. Sofortige Daten und kreatives Brainstorming in Ihrem Arbeitsbereich.

Verwandeln Sie Text mühelos in ansprechende Videos mit SpikeX AI, der führenden Text-zu-Video-KI-Plattform zur Automatisierung des YouTube-Wachstums in wenigen Minuten! Erstellen Sie mit nur einer Eingabeaufforderung gesichtslose Videos für YouTube und soziale Medien.

Locofy.ai konvertiert Figma- und Penpot-Designs in entwicklerfreundlichen Code für React, React Native, HTML-CSS, Flutter und mehr. Erstellen Sie UIs mit KI 10x schneller. Vertraut von über 500.000 Entwicklern.

Knowlee ist eine KI-Agentenplattform, die Aufgaben in verschiedenen Apps wie Gmail und Slack automatisiert, Zeit spart und die Geschäftsproduktivität steigert. Erstellen Sie benutzerdefinierte KI-Agenten, die auf die individuellen Bedürfnisse Ihres Unternehmens zugeschnitten sind und sich nahtlos in Ihre bestehenden Tools und Workflows integrieren.

Jumper ist ein KI-gestützter Video-Schnittassistent, der Videoeditoren hilft, die perfekten Aufnahmen und gesprochenen Inhalte sofort zu finden und so bei jedem Projekt Stunden zu sparen. Lässt sich in Final Cut Pro, Adobe Premiere Pro, DaVinci Resolve und Avid Media Composer integrieren.

Jarvis AI ist ein KI-Copilot-Chatbot, der ChatGPT, Claude und Gemini integriert. Übersetzen, Grammatik prüfen, umschreiben und Aufgaben mit einem Tool automatisieren. Kostenlose Chrome-Erweiterung, Desktop- und mobile Apps verfügbar.



Joint Angels automatisiert die Messung des Gelenkbewegungsbereichs und spart so Zeit bei klinischen Beurteilungen und der Dokumentation. Von medizinischem Fachpersonal empfohlen.

Drafthorse AI ist eine KI-SEO-Engine, um den organischen Traffic von Websites zu steigern. Generieren Sie detaillierte, SEO-optimierte Artikel in wenigen Minuten, indem Sie Ziel-Keywords hochladen. Integriert sich in WordPress, Webflow, Shopify und mehr. Melden Sie sich kostenlos an!

I18n Studio ist ein GPT4-gestütztes macOS-Entwicklertool, das kontextbezogene Übersetzungen für JSON, XML, Localizable.strings und String Catalogs bietet und die App-Lokalisierung erleichtert.

TypingMind ist eine KI-Chat-UI, die GPT-4, Gemini, Claude und andere LLMs unterstützt. Verwenden Sie Ihre API-Schlüssel und zahlen Sie nur für das, was Sie nutzen. Beste Chat-LLM-Frontend-UI für alle KI-Modelle.

Greifen Sie mit Solvemigo über Telegram auf ChatGPT, Whisper und Dall-E zu! Erhalten Sie KI-gestützte Texterstellung, Marketing, Codierung, Kunsterzeugung und Expertenrat rund um die Uhr. 9,99 $/Monat.