반응형

오늘은 OpenAI의 첫 개발자 컨퍼런스에 대해 이야기해 볼까 합니다. 이번 행사는 정말 흥미로운 발표들로 가득했습니다. 샘 알트먼 CEO의 기조연설부터 시작해 새로운 모델과 개발자를 위한 신기능들이 소개되었는데, 어떤 내용이 있었는지 함께 살펴보겠습니다.

샘 알트먼 CEO는 연설을 시작하며 지난해 11월 30일, ChatGPT 출시 이후 1년 사이에 벌어진 변화들을 언급했습니다. 현재 약 200만 명의 개발자가 API를 기반으로 다양한 사례를 개발하며 놀라운 일을 하고 있으며, 포춘 500대 기업 중 92%가 OpenAI의 제품을 사용하고 있다고 합니다. 또한, ChatGPT는 한주에 약 1억 명의 유저가 사용하고 있다고 밝혔습니다.


#1. GPT-4 Turbo 업데이트

GPT-4 Turbo 특징 및 사용방법

이날 가장 주목받은 발표는 'GPT-4 Turbo'였습니다. GPT-4 Turbo는 이전 버전인 GPT-4보다 더 빨라지고, 한 번에 더 많은 콘텐츠를 이해하고 처리할 수 있는 능력을 갖추었습니다. GPT-4 Turbo는 한 질문에서 최대 128,000개의 컨텍스트 토큰을 지원하며, 이는 일반적인 책 300페이지 분량에 해당하는 양입니다.

GPT-4 Turbo는 더 높은 능력을 가지고 있으며 2023년 4월까지의 의 최신 정보를 포함하고 있습니다.

유료 사용자는 API에서 'gpt-4-1106-preview' Model을 선택하여 GPT-4 Turbo를 사용할 수 있습니다. 앞으로 몇 주 안에 추가적인 모델을 출시할 계획이라고 합니다.

개선된 구조

개발자는 이제 모델의 응답과 출력을 더 잘 제어할 수 있게 되었습니다. 응답 형식을 { type: "json_object" } 지정하여 JSON 모드로 API 호출할 수 있고, 새로운 seed 매개변수를 통해 모델이 일관된 완성을 반환하도록 하여 디버깅, 단위 테스트 작성, 높은 수준의 모델 동작 제어가 가능하게 됩니다.

가격 인하 및 더 높은 요율 제한

샘 알트먼 CEO는 GPT-4 Turbo의 가격에 대해서도 언급했습니다. GPT-4 Turbo의 프롬프트 토큰 가격은 GPT-4보다 3배 저렴하며, 출력 토큰은 2배 더 지급된다고 합니다. 즉, 프롬프트 입력 토큰은 1,000개당 1센트, 출력 토큰은 1,000개당 3센트로 되어 있습니다. 대부분의 고객이 비용을 3.75% 절약하여 이용할 수 있다는 것을 의미합니다.

GPT-3.5 Turbo 업데이트

GPT-4 Turbo 외에도, 기본적으로 16K 컨텍스트 윈도우를 지원하는 GPT-3.5 Turbo의 새 버전도 출시합니다. 새로운 3.5 Turbo는 개선된 지시 사항 따르기, JSON 모드, 병렬 기능 호출을 지원합니다. 예를 들어, 내부 평가에서 JSON, XML, YAML 생성과 같은 형식 따르기 작업에서 38%의 개선을 보였습니다. 개발자들은 API에서 'gpt-3.5-turbo-1106'을 호출하여 이 새 모델에 접근할 수 있습니다. 'gpt-3.5-turbo'를 사용하는 애플리케이션은 12월 11일에 자동으로 새 모델로 업그레이드됩니다.


#2. API의 New modalities

GPT-4 Turbo with Vision

GPT-4 Turbo는 이제 Chat Completions API에서 이미지를 입력으로 받아들일 수 있습니다. 이를 통해 사진의 캡션을 생성하거나, 실제 이미지를 상세히 분석하고, 그림이 포함된 문서를 읽는 등의 작업이 가능해졌습니다. 예를 들어, 'BeMyEyes'는 이 기술을 사용하여 시각 장애인이나 저시력자가 제품 식별이나 상점 내비게이션과 같은 일상적인 작업을 수행할 수 있도록 돕습니다. 개발자들은 API에서 'gpt-4-vision-preview'를 사용하여 이 기능에 접근할 수 있습니다. 가격은 입력 이미지 크기에 따라 달라지며, 예를 들어 1080×1080 픽셀 이미지를 GPT-4 Turbo에 전달하는 데는 소요되는 비용은 $0.00765입니다.

DALL·E 3

개발자들은 이제 DALL·E 3를 직접 자신의 앱과 제품에 통합할 수 있습니다. 최근 ChatGPT Plus 및 Enterprise 사용자에게 제공되는 기능이지만, 이미지 API에서 'dall-e-3' 모델을 지정하여 사용할 수 있습니다. Snap, Coca-Cola, Shutterstock과 같은 회사들은 DALL·E 3를 사용하여 고객과 캠페인을 위한 이미지와 디자인을 프로그래밍 방식으로 생성하고 있습니다. 이전 버전의 DALL·E와 마찬가지로, API는 내장된 moderation을 통해 개발자는 애플리케이션이 오용되는 것으로부터 보호할 수 있습니다. 다양한 형식과 품질 옵션을 제공하며, 생성된 이미지 당 가격은 $0.04부터 시작합니다.

Text-to-Speech (TTS)

개발자들은 이제 텍스트를 인간 수준의 음성으로 변환할 수 있는 Text-to-Speech API를 사용할 수 있습니다. 새로운 TTS 모델은 선택할 수 있는 여섯 가지 사전 설정된 목소리와 두 가지 모델 변형, 'tts-1'과 'tts-1-hd'를 제공합니다. 'tts'는 실시간 사용 사례에 최적화되어 있고, 'tts-1-hd'는 품질에 최적화되어 있습니다. 가격은 입력 1,000자 당 $0.015부터 시작합니다.


#3. Assistants API, Retrieval, and Code Interpreter

Assistants API 출시

개발자들이 자체 애플리케이션 내에서 에이전트와 같은 경험을 구축할 수 있도록 돕기 위한 첫 단계인 Assistants API를 출시했습니다. Assistant는 특정 지시사항을 가지고 있으며, 추가 지식을 활용하고, 작업 수행을 위해 모델과 도구를 호출할 수 있는 목적에 맞게 만들어진 AI입니다. 새로운 Assistants API는 코드 인터프리터와 검색 기능뿐만 아니라 기능 호출을 제공하여 이전에 직접 해야 했던 많은 복잡한 작업을 처리하고, 고품질의 AI 앱을 구축할 수 있도록 합니다.

API의 유연성

이 API는 유연성을 위해 설계되었으며, 사용 사례는 자연어 기반 데이터 분석 앱, 코딩 보조, AI 구동 휴가 계획기, 음성 제어 DJ, 스마트 비주얼 캔버스 등 다양합니다. Assistants API는 ChatGPT에서 Beta로 소개되었던 기능 custom instructions, Code interpreter, Retrieval, function calling과 같은 도구를 활용하는 새로운 GPTs 제품을 만들 수 있도록 지원합니다.

  • Code interpreter : 샌드박스 실행 환경에서 Python 코드를 작성하고 실행하며, 그래프와 차트를 생성하고, 다양한 데이터와 형식을 가진 파일을 처리할 수 있습니다. 이를 통해 Assistant는 코드와 수학 문제를 반복적으로 해결할 수 있습니다.
  • Retrieval : 모델 외부의 지식, 예를 들어 독자적인 도메인 데이터, 제품 정보 또는 사용자가 제공한 문서와 같은 지식으로 Assistant를 강화합니다. 이는 문서에 대한 임베딩을 계산하고 저장하거나, 청킹 및 검색 알고리즘을 구현할 필요가 없음을 의미합니다. Assistants API는 ChatGPT에서 지식 검색을 구축하는 데 얻은 경험을 바탕으로 어떤 검색 기술을 사용할지 최적화합니다.
  • Function calling : 개발자가 정의한 기능을 호출하고 그 응답을 메시지에 포함시키도록 Assistant를 활성화합니다.

데이터 보안

마찬가지로, OpenAI API에 전달된 데이터와 파일은 모델을 훈련하는 데 사용되지 않으며, 개발자는 적절하다고 판단될 때 데이터를 삭제할 수 있습니다.

Assistants API 체험

코드 작성 없이 Assistants API 베타를 체험해보고 싶다면 Assistants Playground로 이동하면 됩니다.

 

OpenAI Assistants API: 시작하기 (Python)

OpenAI의 API를 활용하는 개발자 수가 200만 명을 넘어섰습니다. 이제 새로운 기술이 형성되고 활용되는 방식에 중대한 변화가 일어나고 있음이 분명해졌습니다. 지난 2023년 11월 6일에 있었던 OpenAI

yunwoong.tistory.com


#4. 모델 맞춤 설정

GPT-4 Fine Tuning 실험 접근 프로그램

샘 알트먼은 GPT-4 fine tuning에 대한 실험적 접근 프로그램을 시작한다고 발표했습니다. 초기 결과에 따르면, GPT-4 fine tuning은 GPT-3.5 fine tuning에서 실현된 상당한 개선에 비해 기본 모델을 뛰어넘는 의미 있는 개선을 달성하기 위해 더 많은 작업이 필요하다고 합니다. GPT-4 fine tuning의 품질과 안전성이 향상되면 GPT-3.5 fine tuning을 활발히 사용하는 개발자들에게 fine tuning 콘솔 내에서 GPT-4 프로그램에 지원할 수 있는 옵션을 제공한다고 합니다.

Custom Models 프로그램

fine tuning으로 충분한 맞춤 설정을 제공받지 못하는 조직들을 위해(특히 매우 큰 독자적 데이터셋을 보유한 도메인에 해당), OpenAI는 Custom Models 프로그램도 시작합니다. 이 프로그램은 선정된 조직들이 OpenAI 연구진과 협력하여 특정 도메인에 맞춤화된 GPT-4를 훈련할 수 있는 기회를 제공합니다. 이는 추가적인 도메인 특화 사전 훈련부터 특정 도메인에 맞춤화된 custom RL 후훈련 과정까지 모델 훈련 과정의 모든 단계를 수정하는 것을 포함합니다. 조직들은 자신들의 custom models에 대한 독점적 접근 권한을 가지며 기존의 엔터프라이즈 개인정보 보호 정책에 따라, custom models는 다른 고객에게 제공되거나 공유되지 않습니다. 다른 모델을 훈련하는 데에도 사용되지 않습니다.


#5. 마이크로소프트와의 파트너십

사티아 나델라 마이크로소프트 회장도 무대에 올라 OpenAI와의 파트너십을 강조했습니다. OpenAI와 함께 개발자들에게 최고의 시스템을 제공하기 위해 노력하고 있다고 말하며 이 파트너십을 통해, 개발자들은 더 많은 자원과 도구를 이용할 수 있게 되었다고 소개했습니다.


#6. GPTs : 맞춤형 ChatGPT의 새로운 지평

GPTs 소개

OpenAI는 이제 특정 목적을 위해 맞춤화된 ChatGPT 버전을 만들 수 있는 GPTs를 선보였습니다. GPTs는 일상생활, 특정 작업, 직장이나 가정에서 더 유용하게 활용할 수 있도록 ChatGPT를 맞춤 설정할 수 있는 새로운 방법이며 다른 사람들과 공유할 수도 있습니다. 예를 들어, GPTs는 보드 게임의 규칙을 배우는 데 도움을 줄 수 있으며, 아이들에게 수학을 가르치거나 스티커를 디자인하는 데에도 활용할 수 있습니다.

GPTs 만들기

GPTs를 만드는 것은 코딩 없이도 누구나 쉽게 할 수 있습니다. GPTs를 만드는 것은 웹 검색, 이미지 생성, 데이터 분석 등 "GPT가 무엇을 하게 시킬까" 결정하는 것처럼 간단합니다. 개인적인 용도로, 회사 내부 사용으로, 또는 모든 사람을 위해 만들 수 있습니다. ChatGPT Plus 및 Enterprise 사용자는 오늘부터 Canva와 Zapier AI Actions를 포함한 예제 GPTs를 사용해 볼 수 있습니다. chat.openai.com/create에서 가능합니다. 아직 서비스를 이용하지 못할 수도 있지만 더 많은 사용자에게 GPTs를 제공할 계획이라고 합니다.

 

맞춤형 GPTs의 시대: 나만의 AI 만들기 (초보가이드)

OpenAI DevDay에서 발표된 GPT-4 Turbo는 분명히 주목할만했지만 개인적으로 더 큰 충격과 흥미를 불러일으킨 것은 바로 맞춤형 GPT, 개인화된 인공지능 어시스턴트를 만들고 배포할 수 있는 GPTs였습니

yunwoong.tistory.com

GPTs로 ChatGPT를 특정 목적에 맞게 개인화

ChatGPT 출시 이후, 많은 사용자들이 특정 용도에 맞게 ChatGPT를 개인화할 수 있는 방법을 요구해 왔습니다. 7월에는 사용자의 선호도를 설정할 수 있는 Custom Instructions (Beta) 기능을 출시했지만, 사용자들은 더 많은 제어를 원했다고 합니다. 많은 유저들은 ChatGPT에 자신이 원하는 정교하게 만들어진 프롬프트와 지시 목록을 별도로 보관하고 있다가 사용 시에 다시 붙여 넣어 수행해야 했었습니다. 이제 GPTs가 그 모든 작업을 대신해 준다고 합니다.

GPT 스토어 출시 예정

GPTs를 만들어 공개적으로 공유할 수 있습니다. 11월 말에는 검증된 Builder들의 창작물을 선보이는 GPT 스토어를 출시할 예정입니다. 스토어에 등록되면 GPTs는 검색 가능해지며 생산성, 교육, "just for fun"와 같은 카테고리에서 가장 유용하고 즐거운 GPTs는 리더보드에서 상위에 올라갈 수 있습니다. 앞으로 몇 달 안에는 GPTs를 사용하는 사람들의 수에 따라 수익을 창출할 수 있는 기회도 제공될 것입니다.

개인정보 및 안전을 고려하여 GPTs를 구축

정말 OpenAI는 데이터 보안에 대해 끊임없이 강조하는 것 같습니다. 항상 그렇듯, ChatGPT에서는 데이터에 대한 제어권이 사용자에게 있습니다. GPTs와의 채팅은 Builder와 공유되지 않으며 GPT가 타사 API를 사용하는 경우, 해당 API로 데이터를 전송할지 여부를 선택할 수 있습니다. Builder가 자체 GPT를 행동이나 지식으로 개인화할 때, 그 GPT와 사용자 채팅을 모델 개선 및 훈련에 사용할지 여부를 선택할 수 있습니다. 이러한 선택은 사용자가 모델 훈련에서 전체 계정을 선택 해제할 수 있는 기존의 개인정보 보호 조치를 기반으로 합니다.

OpenAI는 GPTs 사용 정책에 대해 검토하는 새로운 별도 시스템을 구축했습니다. 이 시스템은 기존의 완화 조치를 기반으로 하며, 사기 활동, 증오 내용 또는 성인 테마를 포함하는 해로운 GPTs의 공유를 방지하는 것을 목표로 합니다. 또한, Builder가 신원을 확인할 수 있도록 하여 사용자 신뢰를 구축하는 조치를 취했습니다. 사람들이 GPTs를 사용하는 방법을 지속적으로 모니터링하고, 안전 완화 조치를 업데이트하고 강화합니다. 특정 GPTs에 대한 우려가 있는 경우, GPTs 공유 페이지의 신고 기능을 사용하여 OpenAI에 직접 알릴 수도 있습니다. GPTs는 더 유용하고 똑똑해질 것이며, 결국 실제 세계에서 실제 작업을 수행할 수 있게 될 것입니다. OpenAI는 항상 조심스럽게 미래로 나아가는 것이 중요하다고 생각합니다. 왜냐하면 이는 신중한 기술적 및 안전 작업을 필요로 할 뿐만 아니라, 사회가 적응하는 데 시간이 필요하기 때문입니다. 사회적 합의에 대해 깊이 생각하고 있으며, 곧 더 많은 분석을 공유할 예정입니다.

개발자는 GPTs를 실제 세계에 연결

내장 기능을 사용하는 것 외에도, 하나 이상의 API를 GPTs에 사용할 수 있도록 정의함으로써 사용자 정의 작업을 할 수 있습니다. Plugins처럼, 작업을 통해 GPTs는 외부 데이터를 통합하거나 실제 세계와 상호 작용할 수 있습니다. GPTs를 데이터베이스에 연결하거나, 이메일에 Plugin 하거나, 쇼핑 어시스턴트로 만들 수 있습니다. 예를 들어, 여행 목록 데이터베이스를 통합하거나, 사용자의 이메일 인박스를 연결하거나, 전자 상거래 주문도 가능하게 합니다.

기업 고객은 내부 전용 GPTs를 배포

몇 달 전 ChatGPT Enterprise를 출시한 이후, 비즈니스에 특화된 더 많은 개인화 기능을 원했다고 합니다. 이러한 요구에 부응하기 위해서 GPTs는 특정 사용 사례, 부서 또는 독점 데이터 세트에 대한 ChatGPT 버전을 만들 수 있도록 하였습니다. 기업들은 11월 8일부터 GPTs를 시작할 수 있습니다. 이제 회사 내 사용자들이 코드 없이 내부 전용 GPTs를 설계하고 작업 공간에 안전하게 게시할 수 있습니다. 관리 콘솔을 통해 GPTs의 공유 방식을 선택하고, 외부 GPTs가 비즈니스 내부에서 사용될 수 있는지 여부를 결정할 수 있습니다. 그리고 ChatGPT Enterprise에서의 사용된 모든 정보는 모델 개선에 사용되지 않습니다.

커뮤니티 참여

OpenAI는 많은 사람들이 함께 GPTs를 만들 수 있도록 설계했습니다. 커뮤니티의 참여는 인류에게 이익이 되는 안전한 AGI를 만드는 사명에 있어 매우 중요하다고 강조합니다. 고급 기술에 접근할 수 있는 사람들만 '무엇을 만들 것인가'를 결정하는 것이 아니라 더 다양한 사람들의 그룹이 결정함으로써, 더 안전하고 잘 조화된 AI를 가질 수 있다고 설명합니다.


#7. Copyright Shield

OpenAI는 저작권 보호를 위한 체계적인 노력을 지속해 왔습니다. 고객들에게 더 큰 안정성을 제공하기 위해 'Copyright Shield' 서비스를 새롭게 선보였는데, 저작권 침해에 대한 법적 주장이 제기될 경우, OpenAI가 고객을 대신하여 법적 대응을 지원하고 관련 비용을 부담한다는 내용이었습니다. 이 보호 조치는 ChatGPT Enterprise 서비스와 개발자 플랫폼에서 일반적으로 제공되는 기능에 적용됩니다.


마무리하며

샘 알트먼 CEO는 AI가 기술적, 사회적 혁명을 가져올 것이라고 믿는다고 말하며 연설을 마무리했습니다. 이번 컨퍼런스를 통해 우리는 AI가 어떻게 세상을 변화시키고 있는지, 그리고 앞으로 어떤 가능성을 열어갈지 조금이나마 엿볼 수 있었던 것 같습니다. 이번 컨퍼런스에 대한 내용을 더 알고 싶으시다면, OpenAI에서 자세한 내용을 확인하실 수 있습니다.

반응형