Llama Family : Modèles d'IA open source et communauté

Llama Family

3.5 | 106 | 0
Type:
Projets Open Source
Dernière mise à jour:
2025/09/07
Description:
Rejoignez la Llama Family, une communauté open source dédiée à faire progresser l'IA grâce aux modèles Llama. Explorez divers modèles, contribuez à l'écosystème et aidez à construire vers l'AGI.
Partager:

Vue d'ensemble de Llama Family

Famille Llama : L’écosystème des modèles d’IA open source

Qu’est-ce que la famille Llama ? La famille Llama est une communauté open source dédiée à la promotion du développement de l’intelligence artificielle générale (IAG) par le biais d’efforts de collaboration axés sur les modèles Llama et les technologies connexes. Elle vise à créer une plateforme où les développeurs et les passionnés peuvent contribuer à un écosystème open source couvrant divers aspects de l’IA, des modèles à grande échelle aux modèles plus petits, du texte aux capacités multimodales et des logiciels aux optimisations d’algorithmes matériels.

Composants clés de la famille Llama

  • Modèles: La communauté se concentre sur divers modèles Llama open source par Meta, notamment Llama, Llama 2, Llama 3, Code Llama et Atom. Ces modèles couvrent une gamme de tailles de paramètres et d’ensembles de données d’apprentissage, répondant à différents cas d’utilisation et orientations de recherche.

  • Calcul: La communauté encourage la collaboration et le partage des ressources pour la formation et l’expérimentation des modèles. Cela comprend l’utilisation de ressources GPU telles que la série GeForce RTX, NVIDIA H100 et A100 Tensor Core GPU.

  • Communauté: La famille Llama repose sur sa communauté dynamique de développeurs, de chercheurs et de passionnés. La communauté favorise la collaboration, le partage des connaissances et la cocréation de ressources et d’outils.

Modèles Llama

Meta Llama

Le modèle Llama open source par Meta est largement utilisé dans l’industrie et le milieu universitaire. Les versions incluent 1B, 3B, 8B, 70B et 405B, avec des données d’apprentissage dépassant 15,0 T de jetons. Les modèles de vision incluent 11B et 90B, formés sur plus de 6 milliards de paires image-texte.

Model Training Data Params Tokens Release Date
LLaMA English CommonCrawl, C4, Github, Wikipedia, Gutenberg and Books3, ArXiv, Stack Exchange 7B (6.7B) 1.0T 2023/02/24
13B (13.0B) 1.0T
33B (32.5B) 1.4T
65B (65.2B) 1.4T
Llama 2 A new mix of publicly available online data 7B 2.0T 2023/07/18
13B 2.0T
34B 2.0T
70B 2.0T
Llama 3 A new mix of publicly available online data 8B 15.0T 2024/04/18
70B 15.0T
Llama 3.1 Collected from publicly available sources, over 5% of the Llama 3 pretraining dataset consists of high-quality non-English data that covers over 30 languages 8B 15.0T 2024/07/23
70B 15.0T
405B 15.0T
Llama 3.2 Llama 3.2-Text: A new mix of publicly available online data 1B (1.23B) 9.0T 2024/09/25
3B (3.21B) 9.0T
Llama 3.2-Vision Pretrained on image and text pairs. The instruction tuning data includes publicly available vision instruction datasets, as well as over 3M synthetically generated examples 11B (10.6B) 6B (image, text) pairs
90B (88.8B) 6B (image, text) pairs

Code Llama

Code Llama est formé sur Llama 2 à l’aide de données de code et est classé en modèle de base, modèle Python et modèle Instruct, avec des tailles de paramètres de 7B, 13B, 34B et 70B. Il prend en charge la continuation, le remplissage et la programmation basée sur les instructions de code.

Model Training Data Params Type
Code Llama Based on Llama 2, trained using a public code dataset of 500B tokens. To help the model retain natural language understanding skills, 8% of the sample data comes from natural language datasets related to code. 7B Base Model: a foundational model for code generation tasks
Python: a version specialized for Python
Instruct: a fine-tuned version with human instructions and self-instruct code synthesis data
13B
34B
70B

Atom

Atom, développé conjointement par AtomEcho et la famille Llama, est basé sur l’architecture Llama et formé sur 2,7 T de corpus chinois et multilingues, avec des tailles de paramètres incluant 1B, 7B et 13B. Atom améliore les capacités de langue chinoise du modèle Llama.

Model Training Data Params Tokens Release Date
Atom Chinese and multilingual encyclopedias, books, blogs, news, novels, financial data, legal data, medical data, code, paper, Chinese NLP competition datasets, etc. 1B 2.7T 2023/12/20
7B 2.7T 2023/08/28
13B 2.7T 2023/07/31

Comment contribuer à la famille Llama

  • Rejoignez la communauté: Engagez-vous avec d’autres développeurs et passionnés par le biais de forums, de groupes de discussion et d’événements.
  • Contribuez au code: Soumettez des requêtes d’extraction avec des correctifs de bogues, de nouvelles fonctionnalités ou des améliorations de modèle.
  • Partagez des ressources: Partagez des ensembles de données, des scripts de formation et des modèles préformés avec la communauté.
  • Fournissez des commentaires: Offrez des commentaires sur les modèles et outils existants pour aider à améliorer leur qualité et leur convivialité.

Pourquoi la famille Llama est-elle importante ?

La famille Llama est importante, car elle favorise la collaboration et accélère le développement de modèles d’IA open source. En fournissant une plateforme aux développeurs et aux chercheurs pour partager des ressources et des connaissances, la famille Llama contribue à démocratiser l’accès à la technologie de l’IA et à promouvoir l’innovation.

Conclusion

La famille Llama est une communauté en pleine croissance dédiée à l’avancement de l’IA grâce à la collaboration open source. Rejoignez la famille Llama dès aujourd’hui pour contribuer à l’avenir de l’IA!

Meilleurs outils alternatifs à "Llama Family"

Finseo
Image non disponible
210 0

Finseo est une plateforme de référencement basée sur l'IA pour optimiser le contenu pour Google, ChatGPT, Claude et les plateformes d'IA. Fournit une recherche de mots clés avancée, un suivi du classement et des outils de génération de contenu. Suivez la visibilité de l'IA et améliorez votre présence dans la recherche d'IA.

Plateforme de référencement IA
Tradepost.ai
Image non disponible
318 0

Tradepost.ai : Intelligence de marché basée sur l'IA pour un trading plus intelligent. Analyse en temps réel de l'actualité, des newsletters et des documents SEC.

Trading IA
analyse de marché
Amanu
Image non disponible
458 0

Créez rapidement des applications Telegram pour les startups IA. Chatbots, Mini Apps et infrastructure d'IA. De l'idée au MVP en 4 semaines.

IA
Telegram
Chatbots
Task Hub AI
Image non disponible
303 0

PerfAgents
Image non disponible
216 0

PerfAgents est une plateforme de surveillance synthétique alimentée par l'IA qui simplifie la surveillance des applications web à l'aide de scripts d'automatisation existants. Il prend en charge Playwright, Selenium, Puppeteer et Cypress, garantissant des tests continus et des performances fiables.

surveillance synthétique
昇思MindSpore
Image non disponible
371 0

Le cadre d'IA open source MindSpore de Huawei. Différenciation automatique et parallélisation, une formation, déploiement multi-scénarios. Cadre d'entraînement et d'inférence d'apprentissage profond prenant en charge tous les scénarios du cloud côté terminal, principalement utilisé dans la vision par ordinateur, le traitement du langage naturel et d'autres domaines de l'IA, pour les scientifiques des données, les ingénieurs en algorithmes et autres personnes.

Cadre d'IA
Apprentissage profond
ScholarAI
Image non disponible
159 0

ScholarAI : votre assistant de recherche IA. Résumez des articles, générez des citations, créez des guides d'étude et intégrez des outils conformes à la norme HIPAA via l'API.

Recherche en IA
articles académiques
Mistral AI
Image non disponible
98 0

Mistral AI offre une plateforme d'IA puissante pour les entreprises, fournissant des assistants d'IA personnalisables, des agents autonomes et des solutions d'IA multimodales basées sur des modèles ouverts pour des applications commerciales améliorées.

Plateforme d'IA
LLM
Assistants IA
Robots.txt Generator
Image non disponible
95 0

Générez un fichier robots.txt rapidement et facilement avec ce générateur de Robots.txt open source gratuit. Optimisez votre site pour les moteurs de recherche et contrôlez l'accès des robots d'exploration.

robots.txt
SEO
crawler