Deep Research
Visão geral de Deep Research
Pesquisa Profunda: Um Assistente de Pesquisa Alimentado por IA
O que é Pesquisa Profunda? Pesquisa Profunda é um assistente de pesquisa de código aberto alimentado por IA, projetado para realizar pesquisas iterativas e profundas sobre qualquer tópico. Ele combina o poder dos motores de busca, web scraping e grandes modelos de linguagem (LLMs) para fornecer aos usuários uma compreensão abrangente do assunto escolhido.
Este projeto tem como objetivo oferecer a implementação mais simples de um agente de pesquisa profunda, permitindo que ele refine sua direção de pesquisa ao longo do tempo e se aprofunde em um tópico. O objetivo é manter uma base de código compacta, facilitando a compreensão e a construção.
Como funciona a Pesquisa Profunda?
A Pesquisa Profunda aproveita vários componentes principais para fornecer seus recursos de pesquisa:
- Motores de Busca: Utiliza motores de busca para coletar informações iniciais e identificar fontes relevantes.
- Web Scraping: Extrai conteúdo de páginas da web para coletar informações e dados detalhados.
- Grandes Modelos de Linguagem (LLMs): Emprega LLMs para gerar consultas de pesquisa direcionadas, processar resultados e identificar novas direções de pesquisa.
Principais Recursos da Pesquisa Profunda
- Pesquisa Iterativa: Realiza pesquisas aprofundadas, gerando iterativamente consultas de pesquisa, processando resultados e aprofundando com base nas descobertas.
- Geração Inteligente de Consultas: Usa LLMs para gerar consultas de pesquisa direcionadas com base nos objetivos da pesquisa e nas descobertas anteriores.
- Controle de Profundidade e Amplitude: Oferece parâmetros configuráveis para controlar o escopo (amplitude) e a profundidade da pesquisa.
- Acompanhamento Inteligente: Gera perguntas de acompanhamento para refinar as necessidades de pesquisa e descobrir novos insights.
- Relatórios Abrangentes: Produz relatórios detalhados em markdown com descobertas e fontes, fornecendo uma visão geral clara e organizada da pesquisa.
- Processamento Concorrente: Lida com várias pesquisas e processamento de resultados em paralelo para eficiência, reduzindo o tempo de pesquisa.
Como usar a Pesquisa Profunda?
Para começar com a Pesquisa Profunda, siga estas etapas:
- Requisitos
- Ambiente Node.js
- Chaves de API para:
- API Firecrawl (para pesquisa na web e extração de conteúdo)
- API OpenAI (para modelo o3 mini)
- Configuração
- Clone o repositório:
git clone [repository_url] - Instale as dependências:
npm install - Configure as variáveis de ambiente em um arquivo
.env.local:FIRECRAWL_KEY="your_firecrawl_key" # Se você quiser usar seu Firecrawl auto-hospedado, adicione o seguinte abaixo: # FIRECRAWL_BASE_URL="http://localhost:3002" OPENAI_KEY="your_openai_key" - Para usar o LLM local, comente
OPENAI_KEYe, em vez disso, descomenteOPENAI_ENDPOINTeOPENAI_MODEL:- Defina
OPENAI_ENDPOINTpara o endereço do seu servidor local (por exemplo, "http://localhost:1234/v1") - Defina
OPENAI_MODELpara o nome do modelo carregado no seu servidor local.
- Defina
- Clone o repositório:
- Uso
- Execute o assistente de pesquisa:
npm start - Você será solicitado a:
- Insira sua consulta de pesquisa
- Especifique a amplitude da pesquisa (recomendado: 3-10, padrão: 4)
- Especifique a profundidade da pesquisa (recomendado: 1-5, padrão: 2)
- Responda às perguntas de acompanhamento para refinar a direção da pesquisa
- O sistema então:
- Gere e execute consultas de pesquisa
- Processe e analise os resultados da pesquisa
- Explore recursivamente mais profundamente com base nas descobertas
- Gere um relatório markdown abrangente
- O relatório final será salvo como
report.mdouanswer.mdem seu diretório de trabalho, dependendo dos modos selecionados.
- Execute o assistente de pesquisa:
Concorrência
Se você tiver uma versão paga do Firecrawl ou uma versão local, aumente o ConcurrencyLimit definindo a variável de ambiente CONCURRENCY_LIMIT para melhorar a velocidade. Usuários gratuitos podem encontrar erros de limite de taxa e devem reduzir o limite para 1.
DeepSeek R1
A Pesquisa Profunda funciona bem com o modelo R1. Para usar o R1, defina uma chave de API Fireworks:
FIREWORKS_KEY="api_key"
O sistema mudará automaticamente para R1 em vez de o3-mini quando a chave for detectada.
Endpoints e Modelos Personalizados
Você também pode ajustar o endpoint (para outras APIs compatíveis com OpenAI, como OpenRouter ou Gemini), bem como a string do modelo usando estas variáveis de ambiente:
OPENAI_ENDPOINT="custom_endpoint"
CUSTOM_MODEL="custom_model"
Para quem é a Pesquisa Profunda?
A Pesquisa Profunda é adequada para:
- Pesquisadores que precisam coletar informações detalhadas sobre um tópico específico.
- Alunos que precisam conduzir pesquisas para projetos acadêmicos.
- Profissionais que precisam se manter atualizados sobre as tendências e desenvolvimentos do setor.
- Qualquer pessoa que queira explorar de forma rápida e eficiente um tópico em detalhes.
Por que escolher a Pesquisa Profunda?
- Simplifica a Pesquisa Complexa: Automatiza o processo de coleta e análise de informações, economizando tempo e esforço.
- Descobre Insights Ocultos: Explora um tópico em profundidade, descobrindo insights que podem ser perdidos com os métodos de pesquisa tradicionais.
- Fornece Relatórios Abrangentes: Gera relatórios detalhados que resumem as descobertas e fornecem uma visão geral clara da pesquisa.
- Personalizável e Flexível: Oferece parâmetros configuráveis para adaptar o processo de pesquisa às necessidades específicas.
Licença
A Pesquisa Profunda é lançada sob a Licença MIT, permitindo que os usuários usem e modifiquem livremente o código conforme necessário.
A Pesquisa Profunda agiliza a análise aprofundada de tópicos. Ao automatizar a pesquisa, o web scraping e aproveitar os LLMs para a geração inteligente de consultas, simplifica os processos de pesquisa complexos. Pesquisadores, estudantes e profissionais podem usar esta ferramenta para coletar rapidamente informações abrangentes, descobrir insights e gerar relatórios detalhados, tudo isso mantendo um formato claro e legível. O que diferencia a Pesquisa Profunda é sua capacidade de refinar iterativamente sua direção de pesquisa, aprofundando-se em um tópico a cada iteração.
Melhores ferramentas alternativas para "Deep Research"
Transforme qualquer site em dados limpos e estruturados com Skrape.ai. Nossa API baseada em IA extrai dados em seu formato preferido para treinamento de IA.
WebScraping.AI é uma API de scraping com tecnologia de IA que lida com proxies, navegadores e análise HTML para facilitar o web scraping.
Automatize web scraping, migração de dados do WordPress, importações de produtos de comércio eletrônico e automação de reservas com Firecrawl. Use soluções alimentadas por IA para economizar tempo, reduzir erros e dimensionar seus negócios sem esforço!
Apify é uma plataforma de nuvem completa para web scraping, automação de navegador e agentes de IA. Use ferramentas pré-construídas ou crie seus próprios Actors para extração de dados e automação de fluxo de trabalho.
Hunch é um espaço de trabalho com IA em primeiro lugar que capacita as equipes a usar os principais modelos de IA, gerenciar projetos complexos e aumentar a produtividade. Os recursos incluem modelos, processamento em lote, web scraping e execução de código.
BrowserAct é um web scraper e ferramenta de automação alimentada por IA que permite extrair dados de qualquer site sem codificação. Automatize fluxos de trabalho e integre-se com ferramentas como n8n e Make.
Firecrawl é a API líder de rastreamento, raspagem e busca na web projetada para aplicativos de IA. Ela transforma sites em dados limpos, estruturados e prontos para LLM em escala, alimentando agentes de IA com extração web confiável sem proxies ou dores de cabeça.
SheetMagic traz o poder ilimitado da IA e o web scraping diretamente para o Google Sheets. Gere conteúdo, extraia dados e automatize tarefas sem esforço com a integração do ChatGPT e uma variedade de funções de scraping.
PageLlama converte páginas da web em markdown limpo para prompts de IA, simplificando a transformação de dados para desenvolvedores e entusiastas de IA.
Nextbrowser é um agente de navegador com tecnologia de IA projetado para que os profissionais automatizem tarefas de vendas e marketing, como SEO linkbuilding e alcance de influenciadores. Oferece escalabilidade, controle geográfico e flexibilidade.
Summer AI é um aplicativo de guia de áudio com IA para descobrir histórias, pontos de interesse e eventos locais próximos. Disponível na App Store do iOS.
Databutton é uma plataforma de desenvolvimento de IA que permite aos usuários não técnicos criar produtos SaaS e transformar suas operações de negócios por meio do desenvolvimento de aplicativos com tecnologia de IA.
Explore o AI Library, o catálogo abrangente de mais de 2150 redes neurais e ferramentas de IA para criação de conteúdo generativo. Descubra os melhores modelos de arte IA, ferramentas para texto para imagem, geração de vídeo e mais para impulsionar seus projetos criativos.
Smolagents é uma biblioteca Python minimalista para criar agentes de IA que raciocinam e agem por meio de código. Suporta modelos LLM agnósticos, sandboxes seguros e integração perfeita com o Hugging Face Hub para fluxos de trabalho de agentes baseados em código eficientes.