Llama Family 개요
Llama Family: 오픈 소스 AI 모델 생태계
Llama Family란 무엇인가요? Llama Family는 Llama 모델 및 관련 기술을 중심으로 한 공동 노력을 통해 AGI(Artificial General Intelligence, 범용 인공 지능) 개발을 촉진하는 데 전념하는 오픈 소스 커뮤니티입니다. 이 커뮤니티는 개발자와 매니아가 대규모 모델에서 소규모 모델, 텍스트에서 멀티모달 기능, 소프트웨어에서 하드웨어 알고리즘 최적화에 이르기까지 AI의 다양한 측면을 포괄하는 오픈 소스 생태계에 기여할 수 있는 플랫폼을 만드는 것을 목표로 합니다.
Llama Family의 주요 구성 요소
모델: 커뮤니티는 Meta에서 오픈 소스한 다양한 Llama 모델(Llama, Llama 2, Llama 3, Code Llama, Atom 포함)에 중점을 둡니다. 이러한 모델은 다양한 사용 사례 및 연구 방향에 맞춰 다양한 매개변수 크기와 훈련 데이터 세트를 포괄합니다.
컴퓨팅: 커뮤니티는 모델 훈련 및 실험을 위한 협업 및 리소스 공유를 장려합니다. 여기에는 GeForce RTX 시리즈, NVIDIA H100 및 A100 Tensor Core GPU와 같은 GPU 리소스 활용이 포함됩니다.
커뮤니티: Llama Family의 핵심은 개발자, 연구원 및 매니아로 구성된 활기찬 커뮤니티입니다. 커뮤니티는 협업, 지식 공유, 리소스 및 도구의 공동 생성을 촉진합니다.
Llama 모델
Meta Llama
Meta에서 오픈 소스한 Llama 모델은 산업 및 학계 모두에서 널리 사용됩니다. 버전에는 1B, 3B, 8B, 70B 및 405B가 포함되며, 훈련 데이터는 15.0T 토큰을 초과합니다. Vision 모델에는 11B 및 90B가 포함되며, 60억 개 이상의 이미지-텍스트 쌍으로 훈련되었습니다.
Model | Training Data | Params | Tokens | Release Date |
---|---|---|---|---|
LLaMA | English CommonCrawl, C4, Github, Wikipedia, Gutenberg and Books3, ArXiv, Stack Exchange | 7B (6.7B) | 1.0T | 2023/02/24 |
13B (13.0B) | 1.0T | |||
33B (32.5B) | 1.4T | |||
65B (65.2B) | 1.4T | |||
Llama 2 | A new mix of publicly available online data | 7B | 2.0T | 2023/07/18 |
13B | 2.0T | |||
34B | 2.0T | |||
70B | 2.0T | |||
Llama 3 | A new mix of publicly available online data | 8B | 15.0T | 2024/04/18 |
70B | 15.0T | |||
Llama 3.1 | Collected from publicly available sources, over 5% of the Llama 3 pretraining dataset consists of high-quality non-English data that covers over 30 languages | 8B | 15.0T | 2024/07/23 |
70B | 15.0T | |||
405B | 15.0T | |||
Llama 3.2 | Llama 3.2-Text: A new mix of publicly available online data | 1B (1.23B) | 9.0T | 2024/09/25 |
3B (3.21B) | 9.0T | |||
Llama 3.2-Vision | Pretrained on image and text pairs. The instruction tuning data includes publicly available vision instruction datasets, as well as over 3M synthetically generated examples | 11B (10.6B) | 6B (image, text) pairs | |
90B (88.8B) | 6B (image, text) pairs |
Code Llama
Code Llama는 Llama 2를 기반으로 코드 데이터를 사용하여 훈련되었으며, Base Model, Python Model 및 Instruct Model로 분류되고, 매개변수 크기는 7B, 13B, 34B 및 70B입니다. 코드 연속, 채우기 및 지침 기반 프로그래밍을 지원합니다.
Model | Training Data | Params | Type |
---|---|---|---|
Code Llama | Based on Llama 2, trained using a public code dataset of 500B tokens. To help the model retain natural language understanding skills, 8% of the sample data comes from natural language datasets related to code. | 7B | Base Model: a foundational model for code generation tasks |
Python: a version specialized for Python | |||
Instruct: a fine-tuned version with human instructions and self-instruct code synthesis data | |||
13B | |||
34B | |||
70B |
Atom
Atom은 AtomEcho와 Llama Family가 공동으로 개발했으며, Llama 아키텍처를 기반으로 하고 2.7T의 중국어 및 다국어 코퍼스로 훈련되었으며, 매개변수 크기는 1B, 7B 및 13B입니다. Atom은 Llama 모델의 중국어 언어 기능을 향상시킵니다.
Model | Training Data | Params | Tokens | Release Date |
---|---|---|---|---|
Atom | Chinese and multilingual encyclopedias, books, blogs, news, novels, financial data, legal data, medical data, code, paper, Chinese NLP competition datasets, etc. | 1B | 2.7T | 2023/12/20 |
7B | 2.7T | 2023/08/28 | ||
13B | 2.7T | 2023/07/31 |
Llama Family에 기여하는 방법
- 커뮤니티에 가입: 포럼, 채팅 그룹 및 이벤트를 통해 다른 개발자 및 매니아와 교류하십시오.
- 코드 기여: 버그 수정, 새로운 기능 또는 모델 개선 사항이 포함된 풀 요청을 제출하십시오.
- 리소스 공유: 데이터 세트, 훈련 스크립트 및 사전 훈련된 모델을 커뮤니티와 공유하십시오.
- 피드백 제공: 기존 모델 및 도구에 대한 피드백을 제공하여 품질과 사용성을 개선하는 데 도움을 주십시오.
Llama Family가 중요한 이유
Llama Family는 협업을 촉진하고 오픈 소스 AI 모델 개발을 가속화하기 때문에 중요합니다. 개발자와 연구원이 리소스와 지식을 공유할 수 있는 플랫폼을 제공함으로써 Llama Family는 AI 기술에 대한 액세스를 민주화하고 혁신을 촉진하는 데 도움이 됩니다.
결론
Llama Family는 오픈 소스 협업을 통해 AI 발전에 전념하는 성장하는 커뮤니티입니다. 지금 Llama Family에 가입하여 AI의 미래에 기여하십시오!
"Llama Family"의 최고의 대체 도구



Robin AI는 AI로 법률 팀의 계약을 간소화하여 계약 검토 속도를 80% 향상시키고 3초 만에 조항을 검색합니다. 법률 AI.

Careerflow Career Copilot은 AI 구직 도우미로, AI 자기소개서, 이력서 검토, 채용 지원 자동 완성, 네트워킹 추적기 등을 제공합니다.

Huawei의 오픈 소스 AI 프레임워크 MindSpore. 자동 미분 및 병렬 처리, 한 번의 훈련, 다중 시나리오 배포. 엔드-사이드 클라우드의 모든 시나리오를 지원하는 딥 러닝 훈련 및 추론 프레임워크로, 주로 컴퓨터 비전, 자연어 처리 및 기타 AI 분야에서 데이터 과학자, 알고리즘 엔지니어 등을 대상으로 사용됩니다.

AI Short (ChatGPT Shortcut)은 작업 및 학습 효율성을 높이기 위해 설계된 AI 명령 관리 도구입니다. 엄선된 프롬프트 라이브러리, 원클릭 명령 전송, 다국어 번역 및 개인화된 관리를 제공하여 사용자가 신속하게 정확한 피드백을 얻을 수 있도록 도와줍니다. 우리의 프롬프트 커뮤니티에 가입하여 영감을 공유하고 창의력을 불러일으키며 효율적인 AI 어시스턴트가 가져다주는 편리함과 혁신을 경험하세요!

Promptsideas는 DALL-E, Midjourney, Stable Diffusion, ChatGPT 등을 위한 AI 프롬프트 마켓플레이스입니다. 예술, 글쓰기, 마케팅 및 이미지를 위한 AI 프롬프트를 사고 파십시오.

Brat-Gen은 Charli XCX에서 영감을 받은 맞춤형 Brat 스타일 커버를 만들기 위한 무료 Brat 생성기입니다. 굵은 글꼴로 생생한 커버를 디자인하고 소셜 미디어에서 공유하여 Brat Summer 열풍에 참여하세요!