Swarm
Descripción general de Swarm
Swarm: Framework Ligero de Orquestación Multi-Agente
¿Qué es Swarm?
Swarm es un framework experimental y educativo desarrollado por OpenAI para explorar la orquestación ergonómica y ligera de multi-agentes. Se centra en hacer que la coordinación y ejecución de agentes sea ligera, altamente controlable y fácilmente testeable. Swarm logra esto a través de dos abstracciones primitivas: Agentes y transferencias (handoffs).
Nota: Swarm ha sido reemplazado por el OpenAI Agents SDK, que es una evolución lista para producción de Swarm. Se recomienda migrar al Agents SDK para casos de uso en producción.
¿Cómo funciona Swarm?
Swarm opera permitiendo a los Agentes abarcar instrucciones y herramientas. En cualquier momento, un Agente puede elegir transferir una conversación a otro Agente. Estas primitivas son lo suficientemente poderosas como para expresar dinámicas ricas entre herramientas y redes de agentes, permitiéndote construir soluciones escalables y del mundo real.
Los Agentes de Swarm están impulsados por la Chat Completions API y no tienen estado entre llamadas. La función client.run() implementa un bucle que:
- Obtiene una completion del Agente actual.
- Ejecuta llamadas a herramientas y adjunta resultados.
- Cambia de Agente si es necesario.
- Actualiza las variables de contexto si es necesario.
- Retorna si no se realizan nuevas llamadas a funciones.
¿Por qué elegir Swarm?
Swarm explora patrones que son ligeros, escalables y altamente personalizables por diseño. Es más adecuado para situaciones que tratan con un gran número de capacidades e instrucciones independientes que son difíciles de codificar en un solo prompt.
Características y Conceptos Clave
- Agentes: Abarcan instrucciones y herramientas. Pueden representar flujos de trabajo o pasos específicos definidos por instrucciones y funciones.
- Transferencias (Handoffs): Los Agentes pueden transferir la ejecución a otro Agente.
- Funciones: Los Agentes de Swarm pueden llamar directamente a funciones de Python. Las funciones generalmente deben devolver una cadena (se intentará convertir los valores como una cadena).
- Variables de Contexto: Los Agentes pueden acceder y actualizar variables de contexto, lo que les permite mantener el estado y compartir información.
- Streaming: Swarm soporta streaming de respuestas, proporcionando actualizaciones en tiempo real.
¿Cómo usar Swarm?
Instalación:
pip install git+ssh://git@github.com/openai/swarm.gito
pip install git+https://github.com/openai/swarm.gitInstanciar un cliente Swarm:
from swarm import Swarm client = Swarm()Definir Agentes:
from swarm import Agent agent_a = Agent( name="Agent A", instructions="Eres un agente útil.", functions=[transfer_to_agent_b], ) agent_b = Agent( name="Agent B", instructions="Solo habla en Haikus.", ) def transfer_to_agent_b(): return agent_bEjecutar el Swarm:
response = client.run( agent=agent_a, messages=[{"role": "user", "content": "Quiero hablar con el agente B."}], ) print(response.messages[-1]["content"])
¿Para quién es Swarm?
Swarm es un recurso educativo para desarrolladores curiosos por aprender sobre la orquestación multi-agente. Es adecuado para aquellos que se enfrentan a un gran número de capacidades e instrucciones independientes que son difíciles de codificar en un solo prompt.
Ejemplos
- basic: Ejemplos simples de fundamentos como la configuración, la llamada a funciones, las transferencias y las variables de contexto.
- triage_agent: Ejemplo simple de configurar un paso de triage básico para transferir al agente correcto.
- weather_agent: Ejemplo simple de llamada a funciones.
- airline: Una configuración multi-agente para manejar diferentes solicitudes de servicio al cliente en un contexto de aerolínea.
- support_bot: Un bot de servicio al cliente que incluye un agente de interfaz de usuario y un agente de centro de ayuda con varias herramientas.
- personal_shopper: Un agente de compras personal que puede ayudar a realizar ventas y reembolsar pedidos.
Conclusión
Si bien Swarm ha sido sucedido por el OpenAI Agents SDK, sigue siendo un recurso educativo valioso para comprender la orquestación multi-agente. Proporciona una base para construir flujos de trabajo de AI escalables y personalizables. El Agents SDK es una solución lista para producción para desarrolladores que buscan gestión y recuperación de memoria integradas, lo que representa una evolución significativa de Swarm.
Mejores herramientas alternativas a "Swarm"
Vivgrid es una plataforma de infraestructura de agentes de IA que ayuda a los desarrolladores a construir, observar, evaluar e implementar agentes de IA con protecciones de seguridad e inferencia de baja latencia. Es compatible con GPT-5, Gemini 2.5 Pro y DeepSeek-V3.
Kode es una plataforma sin código que le permite implementar y administrar rápidamente agentes de IA personalizables directamente en los procesos de negocio. Construya flujos de trabajo multiagente inteligentes con facilidad.
UBOS es un sistema operativo empresarial para agentes de IA, que proporciona una plataforma de código bajo para construir, implementar y administrar aplicaciones impulsadas por IA con orquestación multiagente y herramientas de código abierto.
CrewAI es una plataforma multi-agente de código abierto que permite construir y orquestar flujos de trabajo de automatización IA con cualquier LLM y plataforma en la nube para aplicaciones empresariales.
Flowise es una plataforma de desarrollo de IA generativa de código abierto para construir visualmente agentes de IA y orquestación LLM. Construye aplicaciones LLM personalizadas en minutos con una interfaz de usuario de arrastrar y soltar.
Vellum AI es una plataforma de orquestación y observabilidad LLM para construir, evaluar y producir flujos de trabajo y agentes de IA empresarial con un constructor visual y SDK.
Innervu ofrece agentes de IA adaptativos y soluciones de automatización, que empoderan a las empresas con prompts inteligentes, RAG y flujos de trabajo de agentes. Mejore la eficiencia y la seguridad con Innervu.
Descubre ProductCore, una plataforma de IA que revoluciona la gestión de productos con seis agentes especializados para inteligencia 24/7, experimentación rápida y servicios de consultoría nativa en IA para aumentar la velocidad de aprendizaje y decisiones estratégicas.
Chatbots y voicebots de IA para sitios web, e-commerce, salud y finanzas. Automatización de servicio al cliente 24/7 con RAG y LLM. ¡Reserva tu demo gratis hoy!
Marvin es un potente framework de Python para construir aplicaciones de IA con modelos de lenguaje grandes (LLM). Simplifica la gestión de estados, coordinación de agentes y salidas estructuradas para desarrolladores que crean apps inteligentes.
Agency Swarm es un marco de código abierto que extiende OpenAI Agents SDK para construir aplicaciones de IA multiagente confiables con roles personalizables y comunicación orquestada.
Go Agent SDK es un SDK potente y de código abierto para construir, implementar y orquestar agentes de IA inteligentes con Go. Simplifica los flujos de trabajo de agentes e integra herramientas personalizadas.
ZGI es una plataforma de IA de nivel empresarial para el diseño visual de flujo de trabajo de agentes, sistemas RAG avanzados y orquestación multiagente.
RLAMA: Una plataforma de IA para crear sistemas RAG y agentes inteligentes. Construye, despliega y gestiona soluciones de IA con modelos locales.