Llama Family: 오픈 소스 AI 모델 및 커뮤니티

Llama Family

3.5 | 110 | 0
유형:
오픈 소스 프로젝트
최종 업데이트:
2025/09/07
설명:
Llama Family에 가입하여 Llama 모델을 통해 AI 발전에 전념하는 오픈 소스 커뮤니티입니다. 다양한 모델을 탐색하고, 생태계에 기여하고, AGI를 구축하는 데 도움을 주세요.
공유:

Llama Family 개요

Llama Family: 오픈 소스 AI 모델 생태계

Llama Family란 무엇인가요? Llama Family는 Llama 모델 및 관련 기술을 중심으로 한 공동 노력을 통해 AGI(Artificial General Intelligence, 범용 인공 지능) 개발을 촉진하는 데 전념하는 오픈 소스 커뮤니티입니다. 이 커뮤니티는 개발자와 매니아가 대규모 모델에서 소규모 모델, 텍스트에서 멀티모달 기능, 소프트웨어에서 하드웨어 알고리즘 최적화에 이르기까지 AI의 다양한 측면을 포괄하는 오픈 소스 생태계에 기여할 수 있는 플랫폼을 만드는 것을 목표로 합니다.

Llama Family의 주요 구성 요소

  • 모델: 커뮤니티는 Meta에서 오픈 소스한 다양한 Llama 모델(Llama, Llama 2, Llama 3, Code Llama, Atom 포함)에 중점을 둡니다. 이러한 모델은 다양한 사용 사례 및 연구 방향에 맞춰 다양한 매개변수 크기와 훈련 데이터 세트를 포괄합니다.

  • 컴퓨팅: 커뮤니티는 모델 훈련 및 실험을 위한 협업 및 리소스 공유를 장려합니다. 여기에는 GeForce RTX 시리즈, NVIDIA H100 및 A100 Tensor Core GPU와 같은 GPU 리소스 활용이 포함됩니다.

  • 커뮤니티: Llama Family의 핵심은 개발자, 연구원 및 매니아로 구성된 활기찬 커뮤니티입니다. 커뮤니티는 협업, 지식 공유, 리소스 및 도구의 공동 생성을 촉진합니다.

Llama 모델

Meta Llama

Meta에서 오픈 소스한 Llama 모델은 산업 및 학계 모두에서 널리 사용됩니다. 버전에는 1B, 3B, 8B, 70B 및 405B가 포함되며, 훈련 데이터는 15.0T 토큰을 초과합니다. Vision 모델에는 11B 및 90B가 포함되며, 60억 개 이상의 이미지-텍스트 쌍으로 훈련되었습니다.

Model Training Data Params Tokens Release Date
LLaMA English CommonCrawl, C4, Github, Wikipedia, Gutenberg and Books3, ArXiv, Stack Exchange 7B (6.7B) 1.0T 2023/02/24
13B (13.0B) 1.0T
33B (32.5B) 1.4T
65B (65.2B) 1.4T
Llama 2 A new mix of publicly available online data 7B 2.0T 2023/07/18
13B 2.0T
34B 2.0T
70B 2.0T
Llama 3 A new mix of publicly available online data 8B 15.0T 2024/04/18
70B 15.0T
Llama 3.1 Collected from publicly available sources, over 5% of the Llama 3 pretraining dataset consists of high-quality non-English data that covers over 30 languages 8B 15.0T 2024/07/23
70B 15.0T
405B 15.0T
Llama 3.2 Llama 3.2-Text: A new mix of publicly available online data 1B (1.23B) 9.0T 2024/09/25
3B (3.21B) 9.0T
Llama 3.2-Vision Pretrained on image and text pairs. The instruction tuning data includes publicly available vision instruction datasets, as well as over 3M synthetically generated examples 11B (10.6B) 6B (image, text) pairs
90B (88.8B) 6B (image, text) pairs

Code Llama

Code Llama는 Llama 2를 기반으로 코드 데이터를 사용하여 훈련되었으며, Base Model, Python Model 및 Instruct Model로 분류되고, 매개변수 크기는 7B, 13B, 34B 및 70B입니다. 코드 연속, 채우기 및 지침 기반 프로그래밍을 지원합니다.

Model Training Data Params Type
Code Llama Based on Llama 2, trained using a public code dataset of 500B tokens. To help the model retain natural language understanding skills, 8% of the sample data comes from natural language datasets related to code. 7B Base Model: a foundational model for code generation tasks
Python: a version specialized for Python
Instruct: a fine-tuned version with human instructions and self-instruct code synthesis data
13B
34B
70B

Atom

Atom은 AtomEcho와 Llama Family가 공동으로 개발했으며, Llama 아키텍처를 기반으로 하고 2.7T의 중국어 및 다국어 코퍼스로 훈련되었으며, 매개변수 크기는 1B, 7B 및 13B입니다. Atom은 Llama 모델의 중국어 언어 기능을 향상시킵니다.

Model Training Data Params Tokens Release Date
Atom Chinese and multilingual encyclopedias, books, blogs, news, novels, financial data, legal data, medical data, code, paper, Chinese NLP competition datasets, etc. 1B 2.7T 2023/12/20
7B 2.7T 2023/08/28
13B 2.7T 2023/07/31

Llama Family에 기여하는 방법

  • 커뮤니티에 가입: 포럼, 채팅 그룹 및 이벤트를 통해 다른 개발자 및 매니아와 교류하십시오.
  • 코드 기여: 버그 수정, 새로운 기능 또는 모델 개선 사항이 포함된 풀 요청을 제출하십시오.
  • 리소스 공유: 데이터 세트, 훈련 스크립트 및 사전 훈련된 모델을 커뮤니티와 공유하십시오.
  • 피드백 제공: 기존 모델 및 도구에 대한 피드백을 제공하여 품질과 사용성을 개선하는 데 도움을 주십시오.

Llama Family가 중요한 이유

Llama Family는 협업을 촉진하고 오픈 소스 AI 모델 개발을 가속화하기 때문에 중요합니다. 개발자와 연구원이 리소스와 지식을 공유할 수 있는 플랫폼을 제공함으로써 Llama Family는 AI 기술에 대한 액세스를 민주화하고 혁신을 촉진하는 데 도움이 됩니다.

결론

Llama Family는 오픈 소스 협업을 통해 AI 발전에 전념하는 성장하는 커뮤니티입니다. 지금 Llama Family에 가입하여 AI의 미래에 기여하십시오!

"Llama Family"의 최고의 대체 도구

Task Hub AI
이미지가 없습니다
303 0

Amanu
이미지가 없습니다
458 0

AI 스타트업을 위한 텔레그램 앱을 빠르게 구축하세요. 챗봇, 미니 앱 및 AI 인프라. 아이디어에서 MVP까지 4주.

텔레그램
챗봇
미니 앱
Robin AI
이미지가 없습니다
324 0

Robin AI는 AI로 법률 팀의 계약을 간소화하여 계약 검토 속도를 80% 향상시키고 3초 만에 조항을 검색합니다. 법률 AI.

법률 AI
계약 검토
법률 기술
Careerflow
이미지가 없습니다
336 1

Careerflow Career Copilot은 AI 구직 도우미로, AI 자기소개서, 이력서 검토, 채용 지원 자동 완성, 네트워킹 추적기 등을 제공합니다.

구직
이력서
경력
昇思MindSpore
이미지가 없습니다
371 0

Huawei의 오픈 소스 AI 프레임워크 MindSpore. 자동 미분 및 병렬 처리, 한 번의 훈련, 다중 시나리오 배포. 엔드-사이드 클라우드의 모든 시나리오를 지원하는 딥 러닝 훈련 및 추론 프레임워크로, 주로 컴퓨터 비전, 자연어 처리 및 기타 AI 분야에서 데이터 과학자, 알고리즘 엔지니어 등을 대상으로 사용됩니다.

AI 프레임워크
딥 러닝
AiShort
이미지가 없습니다
310 0

AI Short (ChatGPT Shortcut)은 작업 및 학습 효율성을 높이기 위해 설계된 AI 명령 관리 도구입니다. 엄선된 프롬프트 라이브러리, 원클릭 명령 전송, 다국어 번역 및 개인화된 관리를 제공하여 사용자가 신속하게 정확한 피드백을 얻을 수 있도록 도와줍니다. 우리의 프롬프트 커뮤니티에 가입하여 영감을 공유하고 창의력을 불러일으키며 효율적인 AI 어시스턴트가 가져다주는 편리함과 혁신을 경험하세요!

생산성
프롬프트 관리
Promptsideas
이미지가 없습니다
326 1

Promptsideas는 DALL-E, Midjourney, Stable Diffusion, ChatGPT 등을 위한 AI 프롬프트 마켓플레이스입니다. 예술, 글쓰기, 마케팅 및 이미지를 위한 AI 프롬프트를 사고 파십시오.

AI 프롬프트 엔지니어링
Brat-Gen
이미지가 없습니다
123 0

Brat-Gen은 Charli XCX에서 영감을 받은 맞춤형 Brat 스타일 커버를 만들기 위한 무료 Brat 생성기입니다. 굵은 글꼴로 생생한 커버를 디자인하고 소셜 미디어에서 공유하여 Brat Summer 열풍에 참여하세요!

Brat 스타일
커버 생성기