Deep Research : Assistant de recherche basé sur l’IA pour une analyse approfondie des sujets

Deep Research

3.5 | 263 | 0
Type:
Projets Open Source
Dernière mise à jour:
2025/10/08
Description:
Deep Research est un assistant de recherche basé sur l’IA qui combine des moteurs de recherche, le web scraping et les LLM pour une recherche itérative et approfondie sur n’importe quel sujet. Simplifie les analyses approfondies grâce à la génération de requêtes intelligentes et à des rapports complets.
Partager:
Recherche IA
LLM
web scraping
récupération d'informations
apprentissage profond

Vue d'ensemble de Deep Research

Recherche Approfondie: Un Assistant de Recherche Alimenté par l'IA

Qu'est-ce que la Recherche Approfondie ? La Recherche Approfondie est un assistant de recherche open source alimenté par l'IA, conçu pour effectuer des recherches itératives et approfondies sur n'importe quel sujet. Il combine la puissance des moteurs de recherche, du web scraping et des grands modèles de langage (LLMs) pour fournir aux utilisateurs une compréhension complète de leur sujet de choix.

Ce projet vise à offrir l'implémentation la plus simple d'un agent de recherche approfondie, lui permettant d'affiner sa direction de recherche au fil du temps et d'approfondir un sujet. L'objectif est de maintenir une base de code compacte, la rendant facile à comprendre et à développer.

Comment fonctionne la Recherche Approfondie ?

La Recherche Approfondie exploite plusieurs composants clés pour fournir ses capacités de recherche :

  • Moteurs de Recherche: Utilise les moteurs de recherche pour recueillir des informations initiales et identifier les sources pertinentes.
  • Web Scraping: Extrait le contenu des pages web pour recueillir des informations et des données détaillées.
  • Grands Modèles de Langage (LLMs): Emploie les LLMs pour générer des requêtes de recherche ciblées, traiter les résultats et identifier de nouvelles directions de recherche.

Caractéristiques Principales de la Recherche Approfondie

  • Recherche Itérative: Mène une recherche approfondie en générant de manière itérative des requêtes de recherche, en traitant les résultats et en approfondissant en fonction des résultats.
  • Génération Intelligente de Requêtes: Utilise les LLMs pour générer des requêtes de recherche ciblées basées sur les objectifs de recherche et les résultats précédents.
  • Contrôle de la Profondeur et de l'Étendue: Offre des paramètres configurables pour contrôler la portée (étendue) et la profondeur de la recherche.
  • Suivi Intelligent: Génère des questions de suivi pour affiner les besoins de recherche et découvrir de nouvelles perspectives.
  • Rapports Complets: Produit des rapports markdown détaillés avec les résultats et les sources, offrant une vue d'ensemble claire et organisée de la recherche.
  • Traitement Concurrent: Gère plusieurs recherches et le traitement des résultats en parallèle pour plus d'efficacité, réduisant le temps de recherche.

Comment utiliser la Recherche Approfondie ?

Pour commencer avec la Recherche Approfondie, suivez ces étapes :

  1. Prérequis
    • Environnement Node.js
    • Clés API pour :
      • API Firecrawl (pour la recherche web et l'extraction de contenu)
      • API OpenAI (pour le modèle o3 mini)
  2. Configuration
    • Clonez le dépôt : git clone [repository_url]
    • Installez les dépendances : npm install
    • Configurez les variables d'environnement dans un fichier .env.local :
      FIRECRAWL_KEY="your_firecrawl_key"
      # Si vous voulez utiliser votre propre instance auto-hébergée de Firecrawl, ajoutez ce qui suit ci-dessous :
      # FIRECRAWL_BASE_URL="http://localhost:3002"
      
      OPENAI_KEY="your_openai_key"
      
    • Pour utiliser un LLM local, commentez OPENAI_KEY et décommentez plutôt OPENAI_ENDPOINT et OPENAI_MODEL :
      • Définissez OPENAI_ENDPOINT sur l'adresse de votre serveur local (par exemple, « http://localhost:1234/v1 »)
      • Définissez OPENAI_MODEL sur le nom du modèle chargé sur votre serveur local.
  3. Utilisation
    • Lancez l'assistant de recherche : npm start
    • Il vous sera demandé de :
      • Saisir votre requête de recherche
      • Spécifier l'étendue de la recherche (recommandé : 3-10, par défaut : 4)
      • Spécifier la profondeur de la recherche (recommandé : 1-5, par défaut : 2)
      • Répondre aux questions de suivi pour affiner la direction de la recherche
    • Le système va alors :
      • Générer et exécuter des requêtes de recherche
      • Traiter et analyser les résultats de recherche
      • Explorer de manière récursive plus en profondeur en fonction des résultats
      • Générer un rapport markdown complet
    • Le rapport final sera enregistré sous le nom report.md ou answer.md dans votre répertoire de travail, selon les modes sélectionnés.

Concurrence

Si vous avez une version payante de Firecrawl ou une version locale, augmentez la valeur de ConcurrencyLimit en définissant la variable d'environnement CONCURRENCY_LIMIT pour améliorer la vitesse. Les utilisateurs gratuits peuvent rencontrer des erreurs de limite de débit et doivent réduire la limite à 1.

DeepSeek R1

La Recherche Approfondie fonctionne bien avec le modèle R1. Pour utiliser R1, définissez une clé API Fireworks :

FIREWORKS_KEY="api_key"

Le système basculera automatiquement vers R1 au lieu de o3-mini lorsque la clé est détectée.

Points de Terminaison et Modèles Personnalisés

Vous pouvez également modifier le point de terminaison (pour d'autres API compatibles avec OpenAI comme OpenRouter ou Gemini) ainsi que la chaîne du modèle en utilisant ces variables d'environnement :

OPENAI_ENDPOINT="custom_endpoint"
CUSTOM_MODEL="custom_model"

À qui s'adresse la Recherche Approfondie ?

La Recherche Approfondie est adaptée pour :

  • Les chercheurs qui ont besoin de recueillir des informations approfondies sur un sujet spécifique.
  • Les étudiants qui ont besoin de mener des recherches pour des projets universitaires.
  • Les professionnels qui ont besoin de se tenir au courant des tendances et des développements de l'industrie.
  • Toute personne qui souhaite explorer rapidement et efficacement un sujet en détail.

Pourquoi choisir la Recherche Approfondie ?

  • Simplifie la Recherche Complexe: Automatise le processus de collecte et d'analyse d'informations, ce qui permet d'économiser du temps et des efforts.
  • Découvre des Perspectives Cachées: Explore un sujet en profondeur, révélant des perspectives qui pourraient être manquées avec les méthodes de recherche traditionnelles.
  • Fournit des Rapports Complets: Génère des rapports détaillés qui résument les résultats et fournissent une vue d'ensemble claire de la recherche.
  • Personnalisable et Flexible: Offre des paramètres configurables pour adapter le processus de recherche à des besoins spécifiques.

Licence

La Recherche Approfondie est publiée sous la licence MIT, permettant aux utilisateurs d'utiliser et de modifier librement le code selon leurs besoins.

La Recherche Approfondie simplifie l'analyse approfondie des sujets. En automatisant la recherche, le web scraping et en tirant parti des LLMs pour la génération intelligente de requêtes, elle simplifie les processus de recherche complexes. Les chercheurs, les étudiants et les professionnels peuvent utiliser cet outil pour recueillir rapidement des informations complètes, découvrir des perspectives et générer des rapports détaillés, tout en conservant un format clair et lisible. Ce qui distingue la Recherche Approfondie, c'est sa capacité à affiner de manière itérative sa direction de recherche, en approfondissant un sujet à chaque itération.

Meilleurs outils alternatifs à "Deep Research"

Olostep
Image non disponible
255 0

Olostep est une API de données web pour l'IA et les agents de recherche. Elle vous permet d'extraire des données web structurées de n'importe quel site web en temps réel et d'automatiser vos flux de travail de recherche web. Les cas d'utilisation incluent les données pour l'IA, l'enrichissement des feuilles de calcul, la génération de prospects, etc.

extraction de données web
API d'IA
Skrape
Image non disponible
455 0

Transformez n'importe quel site Web en données propres et structurées avec Skrape.ai. Notre API basée sur l'IA extrait les données dans votre format préféré pour l'entraînement à l'IA.

web scraping
IA
Hunch
Image non disponible
257 0

Hunch est un espace de travail axé sur l’IA qui permet aux équipes d’utiliser les meilleurs modèles d’IA, de gérer des projets complexes et d’accroître leur productivité. Les fonctionnalités incluent des modèles, le traitement par lots, le web scraping et l’exécution de code.

Espace de travail IA
Firecrawl
Image non disponible
365 0

Automatisez le web scraping, la migration de données WordPress, les importations de produits de commerce électronique et l'automatisation des réservations avec Firecrawl. Utilisez des solutions basées sur l'IA pour gagner du temps, réduire les erreurs et développer votre entreprise sans effort !

automatisation du web scraping
SheetMagic
Image non disponible
262 0

SheetMagic apporte une puissance d'IA illimitée et le web scraping directement dans Google Sheets. Générez du contenu, récupérez des données et automatisez les tâches sans effort grâce à l'intégration de ChatGPT et à une gamme de fonctions de scraping.

IA dans Google Sheets
web scraping
Simplescraper
Image non disponible
371 0

Simplescraper simplifie le web scraping, transformant les sites web en API. Extrayez des données avec une extension Chrome gratuite ou une plateforme cloud. Automatisez l'extraction et l'intégration des données sans effort.

web scraping
extraction de données
Dydas AI Agent
Image non disponible
422 0

Dydas AI Agent offre des outils marketing premium pour la génération de leads et le marketing de contenu. Boostez vos efforts marketing avec des solutions d'agents IA.

agent IA
marketing
Summer AI
Image non disponible
419 0

Summer AI est une application de guide audio IA pour découvrir des histoires à proximité, des points d'intérêt et des événements locaux. Disponible sur l'App Store iOS.

guide audio
voyage IA
Databutton
Image non disponible
575 0

Databutton est une plateforme de développement d'IA qui permet aux utilisateurs non techniques de créer des produits SaaS et de transformer leurs opérations commerciales grâce au développement d'applications basées sur l'IA.

Créateur d'applications IA
PageLlama
Image non disponible
421 0

PageLlama convertit les pages web en markdown propre pour les invites d'IA, simplifiant la transformation des données pour les développeurs et les passionnés d'IA.

web vers markdown
LLM
IA
Firecrawl
Image non disponible
336 0

Firecrawl est l'API de crawling, scraping et recherche web leader conçue pour les applications IA. Elle transforme les sites web en données propres, structurées et prêtes pour LLM à grande échelle, alimentant les agents IA avec une extraction web fiable sans proxies ni tracas.

API de raclage web
crawling web IA
smolagents
Image non disponible
369 0

Smolagents est une bibliothèque Python minimaliste pour créer des agents IA qui raisonnent et agissent via du code. Elle prend en charge les modèles LLM agnostiques, les sandboxes sécurisées et une intégration fluide avec Hugging Face Hub pour des flux de travail d'agents basés sur le code efficaces.

agents de code
intégration LLM
InfraNodus
Image non disponible
409 0

InfraNodus est un outil d'analyse de texte IA qui exploite des graphes de connaissances pour visualiser les textes, révéler les lacunes de contenu et générer de nouveaux insights pour la recherche, l'idéation et l'optimisation SEO.

analyse de réseau de texte
AI Library
Image non disponible
370 0

Explorez AI Library, le catalogue complet de plus de 2150 réseaux neuronaux et outils d'IA pour la création de contenu génératif. Découvrez les meilleurs modèles d'art IA, outils pour texte vers image, génération de vidéo et plus pour booster vos projets créatifs.

catalogue IA
modèles génératifs