Deep Research
Descripción general de Deep Research
Investigación Profunda: Un Asistente de Investigación Impulsado por IA
¿Qué es Investigación Profunda? Investigación Profunda es un asistente de investigación de código abierto impulsado por IA diseñado para realizar investigaciones iterativas y profundas sobre cualquier tema. Combina el poder de los motores de búsqueda, el web scraping y los grandes modelos de lenguaje (LLMs) para proporcionar a los usuarios una comprensión integral del tema elegido.
Este proyecto tiene como objetivo ofrecer la implementación más simple de un agente de investigación profunda, permitiéndole refinar su dirección de investigación con el tiempo y profundizar en un tema. El objetivo es mantener una base de código compacta, facilitando su comprensión y desarrollo.
¿Cómo funciona Investigación Profunda?
Investigación Profunda aprovecha varios componentes clave para ofrecer sus capacidades de investigación:
- Motores de Búsqueda: Utiliza motores de búsqueda para recopilar información inicial e identificar fuentes relevantes.
- Web Scraping: Extrae contenido de páginas web para recopilar información y datos detallados.
- Grandes Modelos de Lenguaje (LLMs): Emplea LLMs para generar consultas de búsqueda específicas, procesar resultados e identificar nuevas direcciones de investigación.
Características Clave de Investigación Profunda
- Investigación Iterativa: Realiza investigaciones en profundidad generando iterativamente consultas de búsqueda, procesando resultados y profundizando en función de los hallazgos.
- Generación Inteligente de Consultas: Utiliza LLMs para generar consultas de búsqueda específicas basadas en los objetivos de investigación y los hallazgos anteriores.
- Control de Profundidad y Amplitud: Ofrece parámetros configurables para controlar el alcance (amplitud) y la profundidad de la investigación.
- Seguimiento Inteligente: Genera preguntas de seguimiento para refinar las necesidades de investigación y descubrir nuevos conocimientos.
- Informes Integrales: Produce informes detallados en markdown con hallazgos y fuentes, proporcionando una visión general clara y organizada de la investigación.
- Procesamiento Concurrente: Maneja múltiples búsquedas y procesamiento de resultados en paralelo para mayor eficiencia, reduciendo el tiempo de investigación.
¿Cómo usar Investigación Profunda?
Para comenzar con Investigación Profunda, sigue estos pasos:
- Requisitos
- Entorno Node.js
- Claves API para:
- API de Firecrawl (para búsqueda web y extracción de contenido)
- API de OpenAI (para el modelo o3 mini)
- Configuración
- Clona el repositorio:
git clone [repository_url] - Instala las dependencias:
npm install - Configura las variables de entorno en un archivo
.env.local:FIRECRAWL_KEY="your_firecrawl_key" # Si quieres usar tu Firecrawl auto-hospedado, añade lo siguiente abajo: # FIRECRAWL_BASE_URL="http://localhost:3002" OPENAI_KEY="your_openai_key" - Para usar LLM local, comenta
OPENAI_KEYy descomentaOPENAI_ENDPOINTyOPENAI_MODELen su lugar:- Establece
OPENAI_ENDPOINTa la dirección de tu servidor local (p. ej., "http://localhost:1234/v1") - Establece
OPENAI_MODELal nombre del modelo cargado en tu servidor local.
- Establece
- Clona el repositorio:
- Uso
- Ejecuta el asistente de investigación:
npm start - Se te pedirá:
- Introduce tu consulta de investigación
- Especifica la amplitud de la investigación (recomendado: 3-10, predeterminado: 4)
- Especifica la profundidad de la investigación (recomendado: 1-5, predeterminado: 2)
- Responde a las preguntas de seguimiento para refinar la dirección de la investigación
- El sistema entonces:
- Generará y ejecutará consultas de búsqueda
- Procesará y analizará los resultados de la búsqueda
- Explorará recursivamente más a fondo basándose en los hallazgos
- Generará un informe completo en markdown
- El informe final se guardará como
report.mdoanswer.mden tu directorio de trabajo, dependiendo de los modos seleccionados.
- Ejecuta el asistente de investigación:
Concurrencia
Si tienes una versión de pago de Firecrawl o una versión local, aumenta el ConcurrencyLimit estableciendo la variable de entorno CONCURRENCY_LIMIT para mejorar la velocidad. Los usuarios gratuitos pueden encontrar errores de límite de velocidad y deben reducir el límite a 1.
DeepSeek R1
Investigación Profunda funciona bien con el modelo R1. Para usar R1, establece una clave API de Fireworks:
FIREWORKS_KEY="api_key"
El sistema cambiará automáticamente a R1 en lugar de o3-mini cuando se detecte la clave.
Endpoints y Modelos Personalizados
También puedes ajustar el endpoint (para otras APIs compatibles con OpenAI como OpenRouter o Gemini) así como la cadena del modelo usando estas variables de entorno:
OPENAI_ENDPOINT="custom_endpoint"
CUSTOM_MODEL="custom_model"
¿Para quién es Investigación Profunda?
Investigación Profunda es adecuado para:
- Investigadores que necesitan recopilar información en profundidad sobre un tema específico.
- Estudiantes que necesitan realizar investigaciones para proyectos académicos.
- Profesionales que necesitan estar al día sobre las tendencias y desarrollos de la industria.
- Cualquier persona que quiera explorar rápida y eficientemente un tema en detalle.
¿Por qué elegir Investigación Profunda?
- Simplifica la Investigación Compleja: Automatiza el proceso de recopilación y análisis de información, ahorrando tiempo y esfuerzo.
- Descubre Conocimientos Ocultos: Explora un tema en profundidad, descubriendo conocimientos que podrían pasarse por alto con los métodos de investigación tradicionales.
- Proporciona Informes Integrales: Genera informes detallados que resumen los hallazgos y proporcionan una visión general clara de la investigación.
- Personalizable y Flexible: Ofrece parámetros configurables para adaptar el proceso de investigación a necesidades específicas.
Licencia
Investigación Profunda se publica bajo la Licencia MIT, permitiendo a los usuarios usar y modificar libremente el código según sea necesario.
Investigación Profunda agiliza el análisis en profundidad de temas. Al automatizar la búsqueda, el web scraping y aprovechar los LLMs para la generación inteligente de consultas, simplifica los procesos de investigación complejos. Investigadores, estudiantes y profesionales pueden usar esta herramienta para recopilar rápidamente información completa, descubrir conocimientos y generar informes detallados, todo ello manteniendo un formato claro y legible. Lo que distingue a Investigación Profunda es su capacidad para refinar iterativamente su dirección de investigación, profundizando en un tema con cada iteración.
Mejores herramientas alternativas a "Deep Research"
Transforme cualquier sitio web en datos limpios y estructurados con Skrape.ai. Nuestra API impulsada por IA extrae datos en su formato preferido para el entrenamiento de IA.
Automatice el web scraping, la migración de datos de WordPress, las importaciones de productos de comercio electrónico y la automatización de reservas con Firecrawl. ¡Utilice soluciones impulsadas por IA para ahorrar tiempo, reducir errores y escalar su negocio sin esfuerzo!
Apify es una plataforma en la nube completa para web scraping, automatización de navegadores y agentes de IA. Utilice herramientas preconstruidas o cree sus propios Actors para la extracción de datos y la automatización del flujo de trabajo.
BrowserAct es un web scraper y herramienta de automatización impulsada por IA que te permite extraer datos de cualquier sitio sin necesidad de programar. Automatiza flujos de trabajo e intégrate con herramientas como n8n y Make.
Hunch es un espacio de trabajo con IA primero que permite a los equipos utilizar los mejores modelos de IA, gestionar proyectos complejos y aumentar la productividad. Las funciones incluyen plantillas, procesamiento por lotes, extracción web y ejecución de código.
Olostep es una API de datos web para IA y agentes de investigación. Le permite extraer datos web estructurados de cualquier sitio web en tiempo real y automatizar sus flujos de trabajo de investigación web. Los casos de uso incluyen datos para IA, enriquecimiento de hojas de cálculo, generación de leads y más.
Simplescraper es una herramienta de web scraping que simplifica la extracción de datos. Ofrece una extensión de Chrome y una plataforma en la nube para convertir sitios web en datos estructurados y contenido listo para LLM, accesible a través de un panel sin código o API.
BestProxy ofrece proxies residenciales ilimitados con IPs residenciales de alta calidad y sin límites de datos, ideal para el raspado de datos de alto volumen, la recopilación de datos de entrenamiento de IA y la protección de la privacidad.
WebScraping.AI es una API de scraping impulsada por IA que gestiona proxies, navegadores y el análisis HTML para facilitar el web scraping.
Summer AI es una aplicación de guía de audio con IA para descubrir historias, puntos de interés y eventos locales cercanos. Disponible en la App Store de iOS.
Databutton es una plataforma de desarrollo de IA que permite a los usuarios no técnicos crear productos SaaS y transformar sus operaciones comerciales a través del desarrollo de aplicaciones impulsado por IA.
Explora AI Library, el catálogo completo de más de 2150 redes neuronales y herramientas de IA para la creación de contenido generativo. Descubre los mejores modelos de arte IA, herramientas para texto a imagen, generación de video y más para potenciar tus proyectos creativos.
PageLlama convierte páginas web a markdown limpio para avisos de IA, simplificando la transformación de datos para desarrolladores y entusiastas de la IA.
Smolagents es una biblioteca Python minimalista para crear agentes IA que razonan y actúan a través de código. Soporta modelos LLM agnósticos, sandboxes seguros e integración con Hugging Face Hub para flujos de trabajo de agentes basados en código eficientes.