Llama Family: Modelos de IA de código aberto e comunidade

Llama Family

3.5 | 234 | 0
Tipo:
Projetos de Código Aberto
Última atualização:
2025/09/13
Descrição:
Junte-se à Llama Family, uma comunidade de código aberto dedicada a avançar a IA através dos modelos Llama. Explore vários modelos, contribua para o ecossistema e ajude a construir em direção à AGI.
Compartilhar:
Modelo Llama
código aberto
comunidade de IA
modelo de linguagem grande
pesquisa de IA

Visão geral de Llama Family

Família Llama: O Ecossistema de Modelos de IA de Código Aberto

O que é a Família Llama? A Família Llama é uma comunidade de código aberto dedicada a promover o desenvolvimento da Inteligência Artificial Geral (IAG) através de esforços colaborativos centrados nos modelos Llama e tecnologias relacionadas. Visa criar uma plataforma onde desenvolvedores e entusiastas possam contribuir para um ecossistema de código aberto que abrange vários aspetos da IA, desde modelos de grande escala a modelos menores, de texto a capacidades multimodais e de software a otimizações de algoritmos de hardware.

Componentes-Chave da Família Llama

  • Modelos: A comunidade concentra-se em vários modelos Llama de código aberto pela Meta, incluindo Llama, Llama 2, Llama 3, Code Llama e Atom. Estes modelos cobrem uma variedade de tamanhos de parâmetros e conjuntos de dados de treino, atendendo a diferentes casos de uso e direções de pesquisa.

  • Computação: A comunidade incentiva a colaboração e a partilha de recursos para treino e experimentação de modelos. Isto inclui a utilização de recursos de GPU como a série GeForce RTX, NVIDIA H100 e A100 Tensor Core GPUs.

  • Comunidade: Central para a Família Llama é a sua vibrante comunidade de desenvolvedores, investigadores e entusiastas. A comunidade fomenta a colaboração, a partilha de conhecimento e a co-criação de recursos e ferramentas.

Modelos Llama

Meta Llama

O modelo Llama de código aberto pela Meta é amplamente utilizado tanto na indústria como na academia. As versões incluem 1B, 3B, 8B, 70B e 405B, com dados de treino que excedem os 15.0T tokens. Os modelos de visão incluem 11B e 90B, treinados em mais de 6 mil milhões de pares imagem-texto.

Model Training Data Params Tokens Release Date
LLaMA English CommonCrawl, C4, Github, Wikipedia, Gutenberg and Books3, ArXiv, Stack Exchange 7B (6.7B) 1.0T 2023/02/24
13B (13.0B) 1.0T
33B (32.5B) 1.4T
65B (65.2B) 1.4T
Llama 2 A new mix of publicly available online data 7B 2.0T 2023/07/18
13B 2.0T
34B 2.0T
70B 2.0T
Llama 3 A new mix of publicly available online data 8B 15.0T 2024/04/18
70B 15.0T
Llama 3.1 Collected from publicly available sources, over 5% of the Llama 3 pretraining dataset consists of high-quality non-English data that covers over 30 languages 8B 15.0T 2024/07/23
70B 15.0T
405B 15.0T
Llama 3.2 Llama 3.2-Text: A new mix of publicly available online data 1B (1.23B) 9.0T 2024/09/25
3B (3.21B) 9.0T
Llama 3.2-Vision Pretrained on image and text pairs. The instruction tuning data includes publicly available vision instruction datasets, as well as over 3M synthetically generated examples 11B (10.6B) 6B (image, text) pairs
90B (88.8B) 6B (image, text) pairs

Code Llama

Code Llama é treinado em cima do Llama 2 usando dados de código e é categorizado em Modelo Base, Modelo Python e Modelo Instruct, com tamanhos de parâmetros de 7B, 13B, 34B e 70B. Suporta continuação, preenchimento e programação baseada em instruções de código.

Model Training Data Params Type
Code Llama Based on Llama 2, trained using a public code dataset of 500B tokens. To help the model retain natural language understanding skills, 8% of the sample data comes from natural language datasets related to code. 7B Base Model: a foundational model for code generation tasks
Python: a version specialized for Python
Instruct: a fine-tuned version with human instructions and self-instruct code synthesis data
13B
34B
70B

Atom

Atom, desenvolvido em conjunto pela AtomEcho e Família Llama, é baseado na arquitetura Llama e treinado em 2.7T de corpus chineses e multilingues, com tamanhos de parâmetros incluindo 1B, 7B e 13B. Atom melhora as capacidades de língua chinesa do modelo Llama.

Model Training Data Params Tokens Release Date
Atom Chinese and multilingual encyclopedias, books, blogs, news, novels, financial data, legal data, medical data, code, paper, Chinese NLP competition datasets, etc. 1B 2.7T 2023/12/20
7B 2.7T 2023/08/28
13B 2.7T 2023/07/31

Como Contribuir para a Família Llama

  • Junte-se à Comunidade: Interaja com outros desenvolvedores e entusiastas através de fóruns, grupos de chat e eventos.
  • Contribua com Código: Submeta pedidos de pull com correções de bugs, novas funcionalidades ou melhorias de modelo.
  • Partilhe Recursos: Partilhe conjuntos de dados, scripts de treino e modelos pré-treinados com a comunidade.
  • Forneça Feedback: Ofereça feedback sobre os modelos e ferramentas existentes para ajudar a melhorar a sua qualidade e usabilidade.

Por que é que a Família Llama é importante?

A Família Llama é importante porque fomenta a colaboração e acelera o desenvolvimento de modelos de IA de código aberto. Ao fornecer uma plataforma para desenvolvedores e investigadores partilharem recursos e conhecimento, a Família Llama ajuda a democratizar o acesso à tecnologia de IA e a promover a inovação.

Conclusão

A Família Llama é uma comunidade crescente dedicada a promover a IA através da colaboração de código aberto. Junte-se à Família Llama hoje para contribuir para o futuro da IA!

Melhores ferramentas alternativas para "Llama Family"

MyShell AI
Imagem não disponível
147 0

MyShell AI é uma camada de consumidor de IA que permite a todos construir, compartilhar e possuir agentes de IA. Explore entretenimento e utilidade baseados em IA com propriedade compartilhada.

Construtor de agentes de IA
llama.cpp
Imagem não disponível
99 0

Habilite a inferência LLM eficiente com llama.cpp, uma biblioteca C/C++ otimizada para diversos hardwares, com suporte a quantização, CUDA e modelos GGUF. Ideal para implantação local e em nuvem.

Inferência LLM
biblioteca C/C++
FinGPT
Imagem não disponível
166 0

FinGPT: Um grande modelo de linguagem financeira de código aberto para democratizar dados financeiros, análise de sentimento e previsão. Ajuste fino rapidamente para obter insights de mercado oportunos.

LLM financeiro
análise de sentimento
ProxyAI
Imagem não disponível
118 0

ProxyAI é um assistente de código com tecnologia de IA para IDEs JetBrains, oferecendo preenchimento de código, edição em linguagem natural e suporte offline com LLMs locais. Melhore sua codificação com IA.

preenchimento de código
Sesame
Imagem não disponível
127 0

Sesame AI tem como objetivo alcançar a 'presença de voz' na IA, fazendo com que as interações faladas pareçam reais e compreensíveis. Explore seu modelo de fala conversacional (CSM) para um diálogo natural.

voz conversacional
geração de fala
OpenUI
Imagem não disponível
119 0

OpenUI é uma ferramenta de código aberto que permite descrever componentes de UI em linguagem natural e renderizá-los ao vivo usando LLMs. Converta descrições em HTML, React ou Svelte para prototipagem rápida.

geração UI
IA generativa
ChatLLaMA
Imagem não disponível
151 0

ChatLLaMA é um assistente de IA treinado com LoRA baseado em modelos LLaMA, permitindo conversas personalizadas no seu GPU local. Inclui GUI de desktop, treinado no dataset HH da Anthropic, disponível para modelos 7B, 13B e 30B.

Ajuste fino LoRA
IA conversacional
Awesome ChatGPT Prompts
Imagem não disponível
195 0

Explore o repositório Awesome ChatGPT Prompts, uma coleção curada de prompts para otimizar ChatGPT e outros LLMs como Claude e Gemini em tarefas de escrita a codificação. Melhore interações com IA usando exemplos comprovados.

Engenharia de prompts
xTuring
Imagem não disponível
137 0

xTuring é uma biblioteca open-source que capacita os usuários a personalizar e fazer fine-tuning de Modelos de Linguagem Grandes (LLMs) de forma eficiente, focando em simplicidade, otimização de recursos e flexibilidade para personalização de IA.

Fine-tuning LLM
Falcon LLM
Imagem não disponível
172 0

Falcon LLM é uma família de modelos de linguagem grandes generativos de código aberto da TII, com modelos como Falcon 3, Falcon-H1 e Falcon Arabic para aplicações de IA multilíngues e multimodais que rodam eficientemente em dispositivos do dia a dia.

LLM de código aberto
Jan
Imagem não disponível
Jan
242 0

Jan é um cliente de IA de código aberto e com prioridade offline. Execute modelos de linguagem grandes (LLM) localmente com privacidade e sem cobranças de API. Conecte-se a vários modelos e serviços.

LLM local
Replicate
Imagem não disponível
201 0

Replicate permite que você execute e ajuste modelos de aprendizado de máquina de código aberto com uma API na nuvem. Construa e dimensione produtos de IA com facilidade.

API de IA
TextGen
Imagem não disponível
217 0

TextGen é um plugin de IA de código aberto para Obsidian, aprimorando a tomada de notas com modelos baseados em IA e geração de conteúdo inteligente.

Obsidian
IA
plugin
Llama 4 Maverick
Imagem não disponível
350 0

Chat online gratuito Llama 4 Maverick, com tecnologia Meta AI. Explore a educação em IA e baixe códigos de modelos grandes. Não requer inscrição.

Chat de IA
LLM
Meta AI