Deep Research : Assistant de recherche basé sur l’IA pour une analyse approfondie des sujets

Deep Research

3.5 | 45 | 0
Type:
Projets Open Source
Dernière mise à jour:
2025/10/08
Description:
Deep Research est un assistant de recherche basé sur l’IA qui combine des moteurs de recherche, le web scraping et les LLM pour une recherche itérative et approfondie sur n’importe quel sujet. Simplifie les analyses approfondies grâce à la génération de requêtes intelligentes et à des rapports complets.
Partager:
Recherche IA
LLM
web scraping
récupération d'informations
apprentissage profond

Vue d'ensemble de Deep Research

Recherche Approfondie: Un Assistant de Recherche Alimenté par l'IA

Qu'est-ce que la Recherche Approfondie ? La Recherche Approfondie est un assistant de recherche open source alimenté par l'IA, conçu pour effectuer des recherches itératives et approfondies sur n'importe quel sujet. Il combine la puissance des moteurs de recherche, du web scraping et des grands modèles de langage (LLMs) pour fournir aux utilisateurs une compréhension complète de leur sujet de choix.

Ce projet vise à offrir l'implémentation la plus simple d'un agent de recherche approfondie, lui permettant d'affiner sa direction de recherche au fil du temps et d'approfondir un sujet. L'objectif est de maintenir une base de code compacte, la rendant facile à comprendre et à développer.

Comment fonctionne la Recherche Approfondie ?

La Recherche Approfondie exploite plusieurs composants clés pour fournir ses capacités de recherche :

  • Moteurs de Recherche: Utilise les moteurs de recherche pour recueillir des informations initiales et identifier les sources pertinentes.
  • Web Scraping: Extrait le contenu des pages web pour recueillir des informations et des données détaillées.
  • Grands Modèles de Langage (LLMs): Emploie les LLMs pour générer des requêtes de recherche ciblées, traiter les résultats et identifier de nouvelles directions de recherche.

Caractéristiques Principales de la Recherche Approfondie

  • Recherche Itérative: Mène une recherche approfondie en générant de manière itérative des requêtes de recherche, en traitant les résultats et en approfondissant en fonction des résultats.
  • Génération Intelligente de Requêtes: Utilise les LLMs pour générer des requêtes de recherche ciblées basées sur les objectifs de recherche et les résultats précédents.
  • Contrôle de la Profondeur et de l'Étendue: Offre des paramètres configurables pour contrôler la portée (étendue) et la profondeur de la recherche.
  • Suivi Intelligent: Génère des questions de suivi pour affiner les besoins de recherche et découvrir de nouvelles perspectives.
  • Rapports Complets: Produit des rapports markdown détaillés avec les résultats et les sources, offrant une vue d'ensemble claire et organisée de la recherche.
  • Traitement Concurrent: Gère plusieurs recherches et le traitement des résultats en parallèle pour plus d'efficacité, réduisant le temps de recherche.

Comment utiliser la Recherche Approfondie ?

Pour commencer avec la Recherche Approfondie, suivez ces étapes :

  1. Prérequis
    • Environnement Node.js
    • Clés API pour :
      • API Firecrawl (pour la recherche web et l'extraction de contenu)
      • API OpenAI (pour le modèle o3 mini)
  2. Configuration
    • Clonez le dépôt : git clone [repository_url]
    • Installez les dépendances : npm install
    • Configurez les variables d'environnement dans un fichier .env.local :
      FIRECRAWL_KEY="your_firecrawl_key"
      # Si vous voulez utiliser votre propre instance auto-hébergée de Firecrawl, ajoutez ce qui suit ci-dessous :
      # FIRECRAWL_BASE_URL="http://localhost:3002"
      
      OPENAI_KEY="your_openai_key"
      
    • Pour utiliser un LLM local, commentez OPENAI_KEY et décommentez plutôt OPENAI_ENDPOINT et OPENAI_MODEL :
      • Définissez OPENAI_ENDPOINT sur l'adresse de votre serveur local (par exemple, « http://localhost:1234/v1 »)
      • Définissez OPENAI_MODEL sur le nom du modèle chargé sur votre serveur local.
  3. Utilisation
    • Lancez l'assistant de recherche : npm start
    • Il vous sera demandé de :
      • Saisir votre requête de recherche
      • Spécifier l'étendue de la recherche (recommandé : 3-10, par défaut : 4)
      • Spécifier la profondeur de la recherche (recommandé : 1-5, par défaut : 2)
      • Répondre aux questions de suivi pour affiner la direction de la recherche
    • Le système va alors :
      • Générer et exécuter des requêtes de recherche
      • Traiter et analyser les résultats de recherche
      • Explorer de manière récursive plus en profondeur en fonction des résultats
      • Générer un rapport markdown complet
    • Le rapport final sera enregistré sous le nom report.md ou answer.md dans votre répertoire de travail, selon les modes sélectionnés.

Concurrence

Si vous avez une version payante de Firecrawl ou une version locale, augmentez la valeur de ConcurrencyLimit en définissant la variable d'environnement CONCURRENCY_LIMIT pour améliorer la vitesse. Les utilisateurs gratuits peuvent rencontrer des erreurs de limite de débit et doivent réduire la limite à 1.

DeepSeek R1

La Recherche Approfondie fonctionne bien avec le modèle R1. Pour utiliser R1, définissez une clé API Fireworks :

FIREWORKS_KEY="api_key"

Le système basculera automatiquement vers R1 au lieu de o3-mini lorsque la clé est détectée.

Points de Terminaison et Modèles Personnalisés

Vous pouvez également modifier le point de terminaison (pour d'autres API compatibles avec OpenAI comme OpenRouter ou Gemini) ainsi que la chaîne du modèle en utilisant ces variables d'environnement :

OPENAI_ENDPOINT="custom_endpoint"
CUSTOM_MODEL="custom_model"

À qui s'adresse la Recherche Approfondie ?

La Recherche Approfondie est adaptée pour :

  • Les chercheurs qui ont besoin de recueillir des informations approfondies sur un sujet spécifique.
  • Les étudiants qui ont besoin de mener des recherches pour des projets universitaires.
  • Les professionnels qui ont besoin de se tenir au courant des tendances et des développements de l'industrie.
  • Toute personne qui souhaite explorer rapidement et efficacement un sujet en détail.

Pourquoi choisir la Recherche Approfondie ?

  • Simplifie la Recherche Complexe: Automatise le processus de collecte et d'analyse d'informations, ce qui permet d'économiser du temps et des efforts.
  • Découvre des Perspectives Cachées: Explore un sujet en profondeur, révélant des perspectives qui pourraient être manquées avec les méthodes de recherche traditionnelles.
  • Fournit des Rapports Complets: Génère des rapports détaillés qui résument les résultats et fournissent une vue d'ensemble claire de la recherche.
  • Personnalisable et Flexible: Offre des paramètres configurables pour adapter le processus de recherche à des besoins spécifiques.

Licence

La Recherche Approfondie est publiée sous la licence MIT, permettant aux utilisateurs d'utiliser et de modifier librement le code selon leurs besoins.

La Recherche Approfondie simplifie l'analyse approfondie des sujets. En automatisant la recherche, le web scraping et en tirant parti des LLMs pour la génération intelligente de requêtes, elle simplifie les processus de recherche complexes. Les chercheurs, les étudiants et les professionnels peuvent utiliser cet outil pour recueillir rapidement des informations complètes, découvrir des perspectives et générer des rapports détaillés, tout en conservant un format clair et lisible. Ce qui distingue la Recherche Approfondie, c'est sa capacité à affiner de manière itérative sa direction de recherche, en approfondissant un sujet à chaque itération.

Meilleurs outils alternatifs à "Deep Research"

fast.ai
Image non disponible
293 0

fast.ai vise à rendre l'apprentissage profond plus accessible. Il propose des cours pratiques, des logiciels comme fastai pour PyTorch, et des ressources pour aider les codeurs à apprendre et à appliquer efficacement les réseaux neuronaux. Comprend un livre, 'Practical Deep Learning for Coders with fastai and PyTorch'.

apprentissage profond
PyTorch
ChatGPT for Google
Image non disponible
92 0

Améliorez vos recherches Google avec ChatGPT pour Google ! Cette extension Chrome affiche les réponses de ChatGPT, Claude et Bard à côté des résultats de recherche. Obtenez-le pour Chrome ou Edge !

Assistant de recherche IA
Keywords AI
Image non disponible
361 0

Keywords AI est une plateforme de surveillance LLM de premier plan conçue pour les startups d'IA. Surveillez et améliorez vos applications LLM en toute simplicité avec seulement 2 lignes de code. Déboguez, testez les prompts, visualisez les journaux et optimisez les performances pour des utilisateurs satisfaits.

Surveillance LLM
débogage IA
SaasPedia
Image non disponible
303 0

SaasPedia est l'agence SEO IA SaaS n°1 qui aide les startups et les entreprises d'IA B2B/B2C à dominer la recherche IA. Nous optimisons pour le référencement AEO, GEO et LLM afin que votre marque soit citée, recommandée et approuvée par ChatGPT, Gemini et Google.

AI SEO
SaaS SEO
LLM SEO
Browse AI
Image non disponible
487 0

Browse AI : Extrayez des données web, surveillez les changements et transformez les sites web en API sans codage. Alimenté par l'IA pour une extraction de données facile et fiable.

web scraping
extraction de données
smolagents
Image non disponible
87 0

Smolagents est une bibliothèque Python minimaliste pour créer des agents IA qui raisonnent et agissent via du code. Elle prend en charge les modèles LLM agnostiques, les sandboxes sécurisées et une intégration fluide avec Hugging Face Hub pour des flux de travail d'agents basés sur le code efficaces.

agents de code
intégration LLM
Finseo
Image non disponible
321 0

Finseo est une plateforme de référencement basée sur l'IA pour optimiser le contenu pour Google, ChatGPT, Claude et les plateformes d'IA. Fournit une recherche de mots clés avancée, un suivi du classement et des outils de génération de contenu. Suivez la visibilité de l'IA et améliorez votre présence dans la recherche d'IA.

Plateforme de référencement IA
Prompt Genie
Image non disponible
93 0

Prompt Genie est un outil alimenté par l'IA qui crée instantanément des super prompts optimisés pour les LLMs comme ChatGPT et Claude, éliminant les tracas de l'ingénierie de prompts. Testez, enregistrez et partagez via l'extension Chrome pour des résultats 10 fois meilleurs.

génération de super prompts
RankRaven
Image non disponible
266 0

RankRaven est un outil de suivi du classement SEO IA qui surveille les performances de votre marque sur les moteurs de recherche IA tels que ChatGPT, Google Bard et Bing Chat. Suivez les mises à jour quotidiennes du classement et analysez les tendances pour optimiser votre stratégie de SEO IA.

Suivi SEO IA
suivi SERP
Upscale.media
Image non disponible
313 0

Upscale.media est un améliorateur d'image IA gratuit pour augmenter la résolution de l'image de 2x, 4x ou 8x. Améliorez la qualité de l'image en ligne tout en conservant la netteté et en supprimant les artefacts. Prend en charge les fichiers PNG, JPEG, JPG, WebP, HEIC.

Amélioration d'image
CapMonster Cloud
Image non disponible
92 0

CapMonster Cloud propose une résolution de CAPTCHA par IA pour reCAPTCHA v2/v3, GeeTest et plus. Contournez les obstacles 2 fois moins cher et 30 fois plus rapide avec intégration API, extensions de navigateur et 99 % de précision pour une automatisation web fluide.

résolution de CAPTCHA
TypingMind
Image non disponible
314 0

TypingMind est une interface utilisateur de chat IA qui prend en charge GPT-4, Gemini, Claude et autres LLM. Utilisez vos clés API et ne payez que ce que vous utilisez. Meilleure interface utilisateur frontend LLM de chat pour tous les modèles d'IA.

Chat IA
LLM
agent IA
Awesome ChatGPT Prompts
Image non disponible
100 0

Explorez le repo Awesome ChatGPT Prompts, une collection curée de prompts pour optimiser ChatGPT et d'autres LLMs comme Claude et Gemini pour des tâches de l'écriture à la codification. Améliorez les interactions AI avec des exemples éprouvés.

Ingénierie de prompts
Voice AI
Image non disponible
106 0

Découvrez Voice AI de pointe avec notre générateur et convertisseur gratuit de texte en parole. Profitez d'une synthèse vocale rapide et de haute qualité alimentée par des modèles d'IA avancés comme Deepseek, Hailuo, Grok et Kling pour un discours naturel et expressif dans diverses applications.

synthèse texte-parole
clonage vocal
Chatsistant
Image non disponible
84 0

Chatsistant est une plateforme IA polyvalente pour créer des chatbots RAG multi-agents alimentés par des LLMs de premier plan comme GPT-5 et Claude. Idéale pour le support client, l'automatisation des ventes et l'e-commerce, avec des intégrations fluides via Zapier et Make.

RAG multi-agent