Deep Research: Asistente de investigación impulsado por IA para análisis de temas en profundidad

Deep Research

3.5 | 39 | 0
Tipo:
Proyectos de Código Abierto
Última actualización:
2025/10/08
Descripción:
Deep Research es un asistente de investigación impulsado por IA que combina motores de búsqueda, web scraping y LLM para una investigación iterativa y en profundidad sobre cualquier tema. Simplifica las inmersiones profundas con generación de consultas inteligente e informes completos.
Compartir:
Investigación de IA
LLM
web scraping
recuperación de información
aprendizaje profundo

Descripción general de Deep Research

Investigación Profunda: Un Asistente de Investigación Impulsado por IA

¿Qué es Investigación Profunda? Investigación Profunda es un asistente de investigación de código abierto impulsado por IA diseñado para realizar investigaciones iterativas y profundas sobre cualquier tema. Combina el poder de los motores de búsqueda, el web scraping y los grandes modelos de lenguaje (LLMs) para proporcionar a los usuarios una comprensión integral del tema elegido.

Este proyecto tiene como objetivo ofrecer la implementación más simple de un agente de investigación profunda, permitiéndole refinar su dirección de investigación con el tiempo y profundizar en un tema. El objetivo es mantener una base de código compacta, facilitando su comprensión y desarrollo.

¿Cómo funciona Investigación Profunda?

Investigación Profunda aprovecha varios componentes clave para ofrecer sus capacidades de investigación:

  • Motores de Búsqueda: Utiliza motores de búsqueda para recopilar información inicial e identificar fuentes relevantes.
  • Web Scraping: Extrae contenido de páginas web para recopilar información y datos detallados.
  • Grandes Modelos de Lenguaje (LLMs): Emplea LLMs para generar consultas de búsqueda específicas, procesar resultados e identificar nuevas direcciones de investigación.

Características Clave de Investigación Profunda

  • Investigación Iterativa: Realiza investigaciones en profundidad generando iterativamente consultas de búsqueda, procesando resultados y profundizando en función de los hallazgos.
  • Generación Inteligente de Consultas: Utiliza LLMs para generar consultas de búsqueda específicas basadas en los objetivos de investigación y los hallazgos anteriores.
  • Control de Profundidad y Amplitud: Ofrece parámetros configurables para controlar el alcance (amplitud) y la profundidad de la investigación.
  • Seguimiento Inteligente: Genera preguntas de seguimiento para refinar las necesidades de investigación y descubrir nuevos conocimientos.
  • Informes Integrales: Produce informes detallados en markdown con hallazgos y fuentes, proporcionando una visión general clara y organizada de la investigación.
  • Procesamiento Concurrente: Maneja múltiples búsquedas y procesamiento de resultados en paralelo para mayor eficiencia, reduciendo el tiempo de investigación.

¿Cómo usar Investigación Profunda?

Para comenzar con Investigación Profunda, sigue estos pasos:

  1. Requisitos
    • Entorno Node.js
    • Claves API para:
      • API de Firecrawl (para búsqueda web y extracción de contenido)
      • API de OpenAI (para el modelo o3 mini)
  2. Configuración
    • Clona el repositorio: git clone [repository_url]
    • Instala las dependencias: npm install
    • Configura las variables de entorno en un archivo .env.local:
      FIRECRAWL_KEY="your_firecrawl_key"
      # Si quieres usar tu Firecrawl auto-hospedado, añade lo siguiente abajo:
      # FIRECRAWL_BASE_URL="http://localhost:3002"
      
      OPENAI_KEY="your_openai_key"
      
    • Para usar LLM local, comenta OPENAI_KEY y descomenta OPENAI_ENDPOINT y OPENAI_MODEL en su lugar:
      • Establece OPENAI_ENDPOINT a la dirección de tu servidor local (p. ej., "http://localhost:1234/v1")
      • Establece OPENAI_MODEL al nombre del modelo cargado en tu servidor local.
  3. Uso
    • Ejecuta el asistente de investigación: npm start
    • Se te pedirá:
      • Introduce tu consulta de investigación
      • Especifica la amplitud de la investigación (recomendado: 3-10, predeterminado: 4)
      • Especifica la profundidad de la investigación (recomendado: 1-5, predeterminado: 2)
      • Responde a las preguntas de seguimiento para refinar la dirección de la investigación
    • El sistema entonces:
      • Generará y ejecutará consultas de búsqueda
      • Procesará y analizará los resultados de la búsqueda
      • Explorará recursivamente más a fondo basándose en los hallazgos
      • Generará un informe completo en markdown
    • El informe final se guardará como report.md o answer.md en tu directorio de trabajo, dependiendo de los modos seleccionados.

Concurrencia

Si tienes una versión de pago de Firecrawl o una versión local, aumenta el ConcurrencyLimit estableciendo la variable de entorno CONCURRENCY_LIMIT para mejorar la velocidad. Los usuarios gratuitos pueden encontrar errores de límite de velocidad y deben reducir el límite a 1.

DeepSeek R1

Investigación Profunda funciona bien con el modelo R1. Para usar R1, establece una clave API de Fireworks:

FIREWORKS_KEY="api_key"

El sistema cambiará automáticamente a R1 en lugar de o3-mini cuando se detecte la clave.

Endpoints y Modelos Personalizados

También puedes ajustar el endpoint (para otras APIs compatibles con OpenAI como OpenRouter o Gemini) así como la cadena del modelo usando estas variables de entorno:

OPENAI_ENDPOINT="custom_endpoint"
CUSTOM_MODEL="custom_model"

¿Para quién es Investigación Profunda?

Investigación Profunda es adecuado para:

  • Investigadores que necesitan recopilar información en profundidad sobre un tema específico.
  • Estudiantes que necesitan realizar investigaciones para proyectos académicos.
  • Profesionales que necesitan estar al día sobre las tendencias y desarrollos de la industria.
  • Cualquier persona que quiera explorar rápida y eficientemente un tema en detalle.

¿Por qué elegir Investigación Profunda?

  • Simplifica la Investigación Compleja: Automatiza el proceso de recopilación y análisis de información, ahorrando tiempo y esfuerzo.
  • Descubre Conocimientos Ocultos: Explora un tema en profundidad, descubriendo conocimientos que podrían pasarse por alto con los métodos de investigación tradicionales.
  • Proporciona Informes Integrales: Genera informes detallados que resumen los hallazgos y proporcionan una visión general clara de la investigación.
  • Personalizable y Flexible: Ofrece parámetros configurables para adaptar el proceso de investigación a necesidades específicas.

Licencia

Investigación Profunda se publica bajo la Licencia MIT, permitiendo a los usuarios usar y modificar libremente el código según sea necesario.

Investigación Profunda agiliza el análisis en profundidad de temas. Al automatizar la búsqueda, el web scraping y aprovechar los LLMs para la generación inteligente de consultas, simplifica los procesos de investigación complejos. Investigadores, estudiantes y profesionales pueden usar esta herramienta para recopilar rápidamente información completa, descubrir conocimientos y generar informes detallados, todo ello manteniendo un formato claro y legible. Lo que distingue a Investigación Profunda es su capacidad para refinar iterativamente su dirección de investigación, profundizando en un tema con cada iteración.

Mejores herramientas alternativas a "Deep Research"

fast.ai
Imagen no disponible
293 0

fast.ai tiene como objetivo hacer que el aprendizaje profundo sea más accesible. Ofrece cursos prácticos, software como fastai para PyTorch y recursos para ayudar a los programadores a aprender y aplicar redes neuronales de manera efectiva. Incluye un libro, 'Practical Deep Learning for Coders with fastai and PyTorch'.

aprendizaje profundo
PyTorch
Keywords AI
Imagen no disponible
361 0

Keywords AI es una plataforma líder de monitoreo LLM diseñada para startups de IA. Monitorea y mejora tus aplicaciones LLM con facilidad usando solo 2 líneas de código. Depura, prueba prompts, visualiza registros y optimiza el rendimiento para usuarios felices.

Monitoreo LLM
depuración de IA
Browse AI
Imagen no disponible
487 0

Browse AI: Extrae datos web, monitorea cambios y convierte sitios web en APIs sin codificación. Impulsado por IA para una extracción de datos fácil y confiable.

web scraping
extracción de datos
smolagents
Imagen no disponible
84 0

Smolagents es una biblioteca Python minimalista para crear agentes IA que razonan y actúan a través de código. Soporta modelos LLM agnósticos, sandboxes seguros e integración con Hugging Face Hub para flujos de trabajo de agentes basados en código eficientes.

agentes de código
integración LLM
Prompt Genie
Imagen no disponible
93 0

Prompt Genie es una herramienta impulsada por IA que crea instantáneamente super prompts optimizados para LLMs como ChatGPT y Claude, eliminando las complicaciones de la ingeniería de prompts. Prueba, guarda y comparte a través de la extensión de Chrome para resultados 10 veces mejores.

generación de super prompts
CapMonster Cloud
Imagen no disponible
92 0

CapMonster Cloud ofrece resolución de CAPTCHA con IA para reCAPTCHA v2/v3, GeeTest y más. Evita obstáculos 2 veces más barato y 30 veces más rápido con integración API, extensiones de navegador y 99% de precisión para automatización web fluida.

resolución de CAPTCHA
SaasPedia
Imagen no disponible
303 0

SaasPedia es la agencia de SEO de IA de SaaS número 1 que ayuda a las empresas emergentes y empresas de IA B2B/B2C a dominar la búsqueda de IA. Optimizamos para AEO, GEO y LLM SEO para que su marca sea citada, recomendada y confiable por ChatGPT, Gemini y Google.

AI SEO
SaaS SEO
LLM SEO
TypingMind
Imagen no disponible
314 0

TypingMind es una interfaz de usuario de chat de IA que admite GPT-4, Gemini, Claude y otros LLM. Utiliza tus claves API y paga solo por lo que usas. La mejor interfaz de usuario frontend LLM de chat para todos los modelos de IA.

Chat de IA
LLM
agente de IA
Awesome ChatGPT Prompts
Imagen no disponible
100 0

Explora el repositorio Awesome ChatGPT Prompts, una colección curada de prompts para optimizar ChatGPT y otros LLMs como Claude y Gemini en tareas desde escritura hasta codificación. Mejora interacciones AI con ejemplos probados.

Ingeniería de prompts
Voice AI
Imagen no disponible
106 0

Experimenta Voice AI de vanguardia con nuestro generador y convertidor gratuito de texto a habla. Disfruta de una síntesis de voz rápida y de alta calidad impulsada por modelos de IA avanzados como Deepseek, Hailuo, Grok y Kling para discursos naturales y expresivos en diversas aplicaciones.

síntesis de texto a voz
Chatsistant
Imagen no disponible
84 0

Chatsistant es una plataforma de IA versátil para crear chatbots RAG multiagente impulsados por LLMs líderes como GPT-5 y Claude. Ideal para soporte al cliente, automatización de ventas y comercio electrónico, con integraciones fluidas vía Zapier y Make.

RAG multiagente
Upscale.media
Imagen no disponible
313 0

Upscale.media es un mejorador de imagen AI gratuito para aumentar la resolución de la imagen en 2x, 4x u 8x. Mejora la calidad de la imagen en línea mientras mantiene la nitidez y elimina los artefactos. Admite archivos PNG, JPEG, JPG, WebP, HEIC.

Mejora de imagen
Neon AI
Imagen no disponible
234 0

Neon AI ofrece soluciones de IA conversacional colaborativa, lo que permite a los expertos trabajar con la IA para tomar decisiones auditables y escalables. Cree expertos en IA inteligentes y aplicaciones de IA conversacional atractivas que comprendan a los usuarios, ofrezcan respuestas personalizadas y revolucionen las interacciones con los clientes.

IA conversacional
IA colaborativa
What-A-Prompt
Imagen no disponible
96 0

What-A-Prompt es un optimizador de prompts fácil de usar para mejorar entradas en modelos de IA como ChatGPT y Gemini. Selecciona potenciadores, ingresa tu prompt y genera resultados creativos y detallados para mejorar las salidas de LLM. Accede a una vasta biblioteca de prompts optimizados.

optimización de prompts
mejora LLM
GPT for Sheets™ Docs™ Forms™ Slides™
Imagen no disponible
158 0

Descubre GPT para Sheets, Docs, Forms y Slides: integración fluida de IA con ChatGPT, Claude, Gemini para escritura, SEO, traducción y automatización en Google Workspace.

Integración Google Sheets