Meta: Llama 3 발표
2024년 4월 18일, Meta에서 새로운 대형 언어 모델인 Llama 3을 공개했습니다. 이 모델은 8B(80억)과 70B(700억) 두 가지 버전으로 제공되며, 다양한 애플리케이션에 적합하도록 사전 훈련 및 지시어 튜닝이 완료된 상태입니다. 매개변수 4,050억 개에 달하는 'Llama 3'는 오는 7월 출시할 예정입니다.

Meta AI
Meta AI
Use Meta AI assistant to get things done, create AI-generated images for free, and get answers to any of your questions. Meta AI is built on Meta's latest Llama large language model and uses Emu, our...
www.meta.ai
Llama 3의 발표와 함께 기대되는 것은 Meta AI입니다. Meta의 최신 대형 언어 모델인 Llama 3를 기반으로 구축된 Meta AI는 일상 속 작은 일부터 큰 일까지 도와줄 수 있는 차세대 AI 어시스턴트로, Facebook, Instagram, WhatsApp, Messenger 등 Meta의 앱에서 무료로 이용할 수 있습니다.

Meta AI는 필요에 맞게 다양한 기능을 제공합니다. 친구들과의 저녁 약속을 계획하거나, 주말여행을 준비하는 일, 시험공부를 하는 데에도 Meta AI가 도움을 줄 수 있습니다. 심지어 첫 아파트로 이사를 가는 상황에서도, Meta AI에게 당신이 원하는 인테리어 스타일을 설명하면 가구 쇼핑에 필요한 영감을 줄 수 있는 이미지를 생성해 줍니다.



Meta AI는 사용하는 앱에서 웹의 실시간 정보에 액세스 할 수 있도록 도와줍니다. Messenger에서 스키 여행을 계획하는 중이라면, Meta AI에게 뉴욕에서 콜로라도로 가는 항공편을 찾아달라고 요청하고, 가장 한적한 주말이 언제인지 알아볼 수 있습니다.

또한, Meta AI의 Imagine 기능을 통해 텍스트에서 이미지를 실시간으로 생성할 수 있습니다. 앨범 아트워크부터 웨딩 사인, 생일 파티 장식, 패션 영감에 이르기까지 Meta AI는 당신의 비전을 더 빠르고 더 나은 품질의 이미지로 생성해 줍니다. 생성된 이미지를 애니메이션 화하거나 새로운 스타일로 반복하거나 GIF로 변환하여 친구들과 공유할 수도 있습니다.

벤치마크 결과
Llama 3의 벤치마크 결과는 인상적입니다. 기본 사전 학습 모델과 명령어 튜닝 모델 모두에서 이전 버전인 Llama 2보다 크게 향상된 성능을 보여주었고, 동종 수준의 모델인 Gemma와 Claude-3와 비교해도 앞선 결과를 보였습니다. 하지만 사용자 입장에서는 새로운 언어 모델이 발표될 때마다 이러한 벤치마크 결과가 강조되지만, 실제로 사용해보면 그다지 만족스럽지 않은 경우가 많았습니다.

이러한 문제를 해결하기 위해 Chatbot Arena라는 플랫폼이 등장했습니다. Chatbot Arena는 사람들의 선호도에 따라 대형 언어 모델(LLM)을 평가하는 개방형 플랫폼입니다. 이 플랫폼은 다양한 사용자 기반의 입력을 활용하여 모델을 쌍대 비교하고, 크라우드소싱을 통해 데이터를 수집합니다. 수개월간 운영되면서 240,000개 이상의 투표를 모았고, 수집된 데이터 분석 결과 크라우드소싱된 질문이 충분히 다양하고 차별적이며, 크라우드소싱된 사람들의 투표가 전문가 평가자의 투표와 잘 일치한다는 것을 확인했습니다. 이러한 분석 결과는 Chatbot Arena의 신뢰성에 대한 확실한 기반을 마련해주었습니다.
Chatbot Arena의 순위를 살펴보면, Llama 3-70B 모델이 5위에 위치해 있습니다. 그 아래로는 Claude 3 Haiku, GPT-4-0613 (작년 모델) 등이 있습니다. 특히 주목할 만한 점은 현재 5위인 Llama 3-70B-Instruct 모델의 매개변수가 70B 정도로, 다른 모델에 비해 현저히 작은 규모라는 것입니다. 이는 Llama 3가 다른 모델의 1/100 정도의 비용으로 유사한 성능을 내고 있음을 보여줍니다.

Llama 3의 경우, 벤치마크뿐만 아니라 실제 사용자 평가에서도 우수한 성능을 보여주고 있어 주목할 만합니다.
책임감 있는 AI 개발을 위한 Meta의 다각적 노력
Llama 3의 출시와 함께 Meta는 대형 언어 모델(LLM)을 사용한 책임감 있는 개발을 위해 다각적인 노력을 기울이고 있습니다. 개발자들이 모델과 시스템 수준의 안전성을 구현하기 위한 단계와 모범 사례를 설명하는 책임 있는 사용 가이드(Responsible Use Guide, RUG)를 업데이트했습니다. Meta는 Llama Guard 2와 Code Shield와 같은 안전 도구를 포함한 다양한 리소스를 제공하는데 이러한 도구는 LLM 시스템에 남아 있을 수 있는 위험을 크게 줄이면서도 높은 수준의 도움을 유지하는 것으로 입증되었다고 설명하고 있습니다. Meta는 개발자들이 자신의 필요에 따라 이러한 안전장치를 조정하고 배포할 것을 권장하며, 시작하는 데 도움이 되는 참조할 수 있는 구현 방법을 제공하고 있습니다. Meta는 확실히 오픈 AI에 대한 헌신과 함께, 개발자 커뮤니티와 협력하여 LLM 기술을 지속적으로 발전시키고자 하는 노력을 보여주고 있습니다.

Meta는 대형 언어 모델(LLM)에 대한 업계 최초이자 가장 광범위한 오픈 소스 사이버 보안 안전 평가 도구인 Cybersec Eval 2를 제공합니다. Cybersec Eval 2는 기존의 안전하지 않은 코딩 관행 및 사이버 공격 도움 평가 외에도 LLM의 프롬프트 인젝션 취약성, 자동화된 공격적 사이버 보안 기능 및 코드 인터프리터 악용 성향을 측정함으로써 이전 버전을 확장했습니다. 이러한 도구와 평가는 개발자들이 LLM 기술을 안전하고 책임감 있게 활용할 수 있도록 지원하며, 생성형 AI의 잠재적 위험을 완화하는 데 도움이 될 것입니다. Meta는 이를 통해 AI 기술의 발전과 함께 신뢰와 안전을 확보하기 위한 선제적인 조치를 취하고 있습니다.

Llama 3는 현재 다양한 플랫폼을 통해 개발자들이 쉽게 접근하고 활용할 수 있습니다. 대표적으로 Hugging Face, Kaggle, 그리고 Google Cloud Vertex AI에서 Llama 3를 사용할 수 있습니다.
'Insights > IT Trends' 카테고리의 다른 글
미스터리 모델 'gpt2'의 실체와 사용법 (57) | 2024.05.11 |
---|---|
Udio: 프롬프트로 생성하는 AI 음악 (사용법) (1) | 2024.04.21 |
세계를 이끄는 빅6 AI 기업 (2024년 4월 기준) (11) | 2024.04.15 |
일론 머스크의 Grok-1.5 발표 (50) | 2024.04.06 |
DigitalOcean App 배포: 간단 가이드 (계정 생성 포함) (17) | 2024.03.13 |
댓글
이 글 공유하기
다른 글
-
미스터리 모델 'gpt2'의 실체와 사용법
미스터리 모델 'gpt2'의 실체와 사용법
2024.05.11최근 LMSYS Chatbot Arena에 정체불명의 언어 모델(LLM)이 등장했습니다. LMSYS Chatbot Arena는 대규모 언어 모델(LLM)의 성능을 평가하는 대규모 벤치마킹 플랫폼입니다. 이 플랫폼은 사용자가 두 개의 LLM이 생성한 응답을 비교하고 선호하는 응답을 선택하도록 요청하는 방식으로 작동합니다. 두 개의 모델은 무작위로 선택되어 제공됩니다. 모델은 GPT-4, Claude3, Gemini, llama 모델 등 39개의 모델들이 있습니다. 이러한 평가를 통해 LMSYS Chatbot Arena는 각 LLM의 강점과 약점을 식별하고 Elo 레이팅 시스템을 사용하여 LLM의 전체 성능을 순위 지정합니다. 각종 LLM 모델이 새로 나올 때마다 벤치마크 점수는 높지만 실제 사용해 보면 기… -
Udio: 프롬프트로 생성하는 AI 음악 (사용법)
Udio: 프롬프트로 생성하는 AI 음악 (사용법)
2024.04.212024년 4월 10일, 구글 딥마인드 출신 공학자들이 만든 오디오 및 음악 생성 인공지능 서비스인 Udio가 베타 버전을 공개했습니다. 이전에도 Suno, Stable Audio 등의 음악 생성 서비스가 있었지만, Udio 역시 간단한 프롬프트로 음악을 생성할 수 있는 획기적인 서비스를 선보였습니다. Udio는 사용자가 원하는 음악 유형에 대한 설명을 입력하면, AI 시스템이 프롬프트에 맞게 독특하고 고품질의 음악을 생성합니다. 비록 인간이 작곡한 음악을 완전히 대체할 수는 없겠지만, 음악가와 음악 애호가 모두에게 강력한 도구가 될 것으로 기대되고 있습니다. 현재 사용자 급증으로 인한 서버 과부하 이슈를 겪고 있기는 하지만, 사람이 없는 시간대에는 40초 만에 30초짜리 곡 2개를 금방 만들어낼 수 있… -
세계를 이끄는 빅6 AI 기업 (2024년 4월 기준)
세계를 이끄는 빅6 AI 기업 (2024년 4월 기준)
2024.04.152022년 11월 30일, ChatGPT의 출시와 함께 인공지능 분야에 새로운 장이 열렸습니다. 이후 1년 4개월이 지난 지금, 우리는 기술 발전의 전쟁터에 서 있습니다. 인공지능은 단순한 기술 발명을 넘어서, 지난 수백 년 간 인류가 이루어낸 주요 기술 혁신만큼이나 중요한 위치를 차지하게 되었습니다. 최근 일론 머스크 테슬라 CEO는 한 인터뷰에서 "내년 말까지 인간보다 더 똑똑한 AI가 등장할 것이며, 5년 내로는 AI의 능력이 인류를 능가할 것"이라고 전망했습니다.이러한 배경 속에서, 빅테크 기업과 AI 스타트업들 사이의 경쟁은 더욱 치열해지고 있습니다. 특히, OpenAI, ANTHROPIC, Mistral AI, Google, Meta, 그리고 xAI까지 포함한 빅6 인공지능 기업들은 각자의 방… -
일론 머스크의 Grok-1.5 발표
일론 머스크의 Grok-1.5 발표
2024.04.063월 28일(현지시간), 일론 머스크(Elon Musk)의 인공지능 스타트업 xAI는 대화형 생성 AI, Grok의 새로운 버전인 Grok-1.5를 발표했습니다. 이 업그레이드는 향상된 추론 기능과 함께 128,000개 토큰의 컨텍스트를 처리할 수 있는 능력을 소개합니다. Grok-1.5는 이번 주내에 소셜 미디어 플랫폼 X(이전의 트위터)에서 초기 테스터 및 기존 Grok 사용자들에게 제공될 예정입니다. Grok-1.5의 주요 개선 사항 Grok-1.5의 출시로 가장 주목받는 개선 사항 중 하나는 코딩 및 수학 관련 작업에서의 성능 향상입니다. MATH 및 GSM8K 벤치마크에서 각각 50.6%, 90%의 점수를 달성함으로써, 초등학교부터 고등학교까지의 다양한 수학 문제를 다룰 수 있는 능력을 입증했습…
댓글을 사용할 수 없습니다.