OpenAI
GPT-4V(ision)를 이용한 객체 탐지(Object Detection) - (Python)
GPT-4V(ision)를 이용한 객체 탐지(Object Detection) - (Python)
2023.11.26이번 글에서는 GPT-4V를 활용하여 객체 탐지(Object Detection)에 대해 알아보겠습니다. 객체 탐지(Object Detection)는 이미지 내 특정 객체를 식별하고, 그 위치를 정확하게 파악하는 과정을 말하며 이미지 분류(Classification)와 위치 파악(Localization)을 동시에 수행하는 이미지 인식 기술입니다. 이미지 분류(Classification)는 이미지 내의 객체가 무엇인지 식별하고 위치 파악(Localization)은 그 객체가 이미지 내 어디 곳에 위치해 있는지를 나타냅니다. #1. 필수 패키지 설치 및 준비 GPT-4V를 활용한 이미지 인식 프로젝트를 시작하기 전에, 필요한 Python 패키지들을 설치하고 준비하는 과정이 필요합니다. 1) 패키지 설치 먼저,..
GPT-4V(ision)를 이용한 이미지 분류(Classification) - (Python)
GPT-4V(ision)를 이용한 이미지 분류(Classification) - (Python)
2023.11.24AI의 발전은 끊임없이 우리의 기술적 지평을 확장시키고 있습니다. 특히, 이미지 인식 분야는 딥러닝의 발전과 함께 급속도로 진화해 왔습니다. 딥러닝 모델들은 이미지 인식, 객체 탐지, 얼굴 인식 등 다양한 분야에서 혁신적인 성과를 이루어냈지만 이러한 모델들은 주로 단일 모달리티, 이미지 데이터만을 처리하는 데 집중했습니다. 이번 글에서는 GPT-4V를 활용하여 딥러닝 모델에서 시도했던 다양한 이미지 인식 방법들을 재해석하고 적용해보려고 합니다. 구체적으로, Classification, Object Detection, Face Recognition, OCR 그리고 이미지 기반 추론 등의 주제를 다룰 예정입니다. 이를 통해 GPT-4V가 딥러닝 모델의 기능을 어떻게 향상할 수 있는지, 그리고 이미지와 텍스트..
샘 알트만: 인공지능으로 세상을 바꾸는 사람
샘 알트만: 인공지능으로 세상을 바꾸는 사람
2023.10.22세상은 변화하고 있습니다. 우리의 삶, 일, 심지어 생각하는 방식마저 기술의 급격한 진보로 인해 달라지고 있습니다. 이 변화의 최전선에는 여러 인물들이 있지만, 그중에서도 특히 '샘 알트만(Sam Altman)'이라는 이름을 빼놓을 수 없습니다. 샘 알트만은 어떻게 기술 천재로부터 혁신의 아이콘으로 변모했을까요? 그리고 그는 어떻게 인공지능의 미래를 바라보고 있을까요? 이 글에서는 인공지능을 통해 인류에게 미칠 영향을 깊이 이해하려는 샘 알트만의 독특한 철학과 접근 방식을 알아보겠습니다. 그의 생각과 행동이 왜 중요한지, 그리고 우리 모두에게 어떤 의미를 갖고 있는지를 파악하기 위해 그의 과거와 현재, 그리고 그가 추구하는 미래에 대해 소개하겠습니다. 유년기 및 교육 샘 알트만은 자신의 컴퓨터 과학에 대..
나만의 ChatGPT Plugin 만들기: NAVER 검색엔진
나만의 ChatGPT Plugin 만들기: NAVER 검색엔진
2023.10.19ChatGPT의 Plugin은 사용자가 자신만의 맞춤형 기능을 개발할 수 있는 강력한 도구입니다. 이전 글에서는 간단하게 Local DB에 저장하는 TODO 리스트 Plugin을 만드는 방법을 소개했습니다. 나만의 ChatGPT Plugin 만들기: TODO List (No Auth) OpenAI의 ChatGPT는 확장 가능한 구조를 가지고 있습니다. 특히 OpenAI는 Plugin이라는 기능을 제공하는데 이는 사용자가 매우 빠르고 간단하게 나만의 기능을 구축할 수 있게 해줍니다. OpenAI에서 소개 yunwoong.tistory.com ChatGPT는 2021년 9월까지의 데이터로 생성된 모델로, 그 이후의 정보나 실시간 업데이트 되는 정보에는 제한이 있었습니다. 이러한 한계를 극복하기 위해, Cha..
ChatGPT: 'Voice Conversations'으로 이젠 듣고 말한다 (사용법)
ChatGPT: 'Voice Conversations'으로 이젠 듣고 말한다 (사용법)
2023.10.14이전에는 "ChatGPT: 'Chat with Images'로 이젠 본다"라는 주제로 이미지와의 대화 기능을 소개했었습니다. 이번에는 ChatGPT가 어떻게 '듣고 말한다'는 것인지 대해 다루려 합니다. ChatGPT: 'Chat with Images'로 이젠 본다 (사용법)AI 분야는 지속적인 혁신과 발전의 흐름 속에서 또 다른 역사적인 순간을 맞이하였습니다. 2023년 3월 14일, OpenAI는 GPT-4를 세상에 공개하였는데, 이는 AI의 대화 능력이 단순한 텍스트 기반에서 벗yunwoong.tistory.com 사실, 저를 포함해 많은 사람들이 이 기능에 대해 엄청난 기대감을 갖고 있을 것입니다. '언제쯤 이 기능을 직접 사용해 볼 수 있을까?'라는 생각으로 기다렸는데, 제가 오해를 하고 있었습..
ChatGPT: 'Chat with Images'로 이젠 본다 (사용법)
ChatGPT: 'Chat with Images'로 이젠 본다 (사용법)
2023.10.14AI 분야는 지속적인 혁신과 발전의 흐름 속에서 또 다른 역사적인 순간을 맞이하였습니다. 2023년 3월 14일, OpenAI는 GPT-4를 세상에 공개하였는데, 이는 AI의 대화 능력이 단순한 텍스트 기반에서 벗어나 이미지와 텍스트를 동시에 처리할 수 있는 멀티모달 시스템으로 발전했음을 의미했습니다. 더 똑똑해진 GPT-4 발표! 무엇이 달라졌을까?독일 마이크로소프트 CTO 안드레아스 브라운은 2023년 3월 9일 독일에서 개최한 이벤트(AI in Focus-Digital Kickoff)에서 "다음 주 GPT-4가 공개될 예정이다"라고 깜짝 발표를 했습니다. 텍스트뿐만 아니라yunwoong.tistory.com ChatGPT의 진화: 이제 보고 듣고 말한다세상은 끊임없이 변화하고 있으며, 그 중심에는 ..
ChatGPT의 DALL·E3 사용법
ChatGPT의 DALL·E3 사용법
2023.10.09지난 9월 21일, OpenAI는 이미지 생성 AI 'DALL·E3'를 발표하였습니다. 이후 Bing Image Creator를 통해 이 기술을 체험해 볼 수 있었으나, ChatGPT 내에서는 사용할 수 없는 상태였습니다. 10월 5일부터 ChatGPT Plus 및 Enterprise 사용자들을 대상으로 DALL·E3의 사용이 순차적으로 공개되기 시작했습니다. DALL·E3의 상세 내용은 아래 글을 참고하시기 바랍니다. OpenAI DALL·E 3 발표: ChatGPT와 통합으로 이미지 생성 AI의 진화 최근 몇 년 동안 AI(인공지능) 분야는 빠른 속도로 발전하고 있으며, 그 중심에는 이미지 및 텍스트 생성 기술이 있습니다. 이미지 생성 영역에서는 Midjourney, leonardo.ai, Adobe..
ChatGPT의 진화: 이제 보고 듣고 말한다
ChatGPT의 진화: 이제 보고 듣고 말한다
2023.09.26세상은 끊임없이 변화하고 있으며, 그 중심에는 기술의 발전이 있습니다. 특히 인공 지능 분야에서의 혁신은 우리의 일상을 크게 바꾸고 있습니다. 그중에서도 대화형 AI, 챗봇의 발전은 눈에 띄게 진화하고 있습니다. 특히, OpenAI의 ChatGPT는 그 선봉에 서 있습니다. OpenAI는 현지시간으로 25일 새로운 음성과 이미지 기능을 ChatGPT에 출시할 것이라고 발표했습니다. ChatGPT can now see, hear, and speak We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to ha..
나만의 ChatGPT Plugin 만들기: TODO List (No Auth)
나만의 ChatGPT Plugin 만들기: TODO List (No Auth)
2023.09.24OpenAI의 ChatGPT는 확장 가능한 구조를 가지고 있습니다. 특히 OpenAI는 Plugin이라는 기능을 제공하는데 이는 사용자가 매우 빠르고 간단하게 나만의 기능을 구축할 수 있게 해줍니다. OpenAI에서 소개하는 기본 예제 중 Todo 리스트를 이용하여 나만의 Plugin을 만들어보도록 하겠습니다. 기본 예제는 리스트에 데이터를 저장하는 방식을 사용하지만, 이 글에서는 데이터를 Sqlite DB에 저장하는 방식으로 조금 더 발전시켜 보겠습니다. ChatGPT의 Todo Plugin을 직접 만들어보며, 로컬 환경에서 어떻게 설정하고 사용하는지에 대한 과정을 단계별로 알아보겠습니다. #1. 환경구성 1) python은 3.10 버전 설치 (가상환경) conda create -n test_env ..
ChatGPT Retrieval Plugin 개발 (4) : ChatGPT에 개발한 Plugin 추가하기
ChatGPT Retrieval Plugin 개발 (4) : ChatGPT에 개발한 Plugin 추가하기
2023.09.23이전 글에서는 ChatGPT Retrieval Plugin을 클라우드에 배포하는 과정을 함께 살펴보았습니다. 이번 글에서는 그 다음 단계인, ChatGPT에 개발한 Plugin을 어떻게 추가하고 활용하는지에 대해 알아보겠습니다. 이제, ChatGPT에 Plugin을 추가하는 방법을 단계별로 함께 알아보겠습니다. #1. 사전 준비 ChatGPT에 Retrieval Plugin을 추가하기 전에 몇 가지 사전 준비 사항을 확인하고 준비해야 합니다. 1) Your Web Site Domain Plugin이 배포된 웹 사이트의 도메인 주소가 필요합니다. 여기서는 DigitalOcean에서 배포한 App의 주소를 사용하게 됩니다. ChatGPT Retrieval Plugin 개발 (3) : 클라우드 배포 앞서 'C..
OpenAI DALL·E 3 발표: ChatGPT와 통합으로 이미지 생성 AI의 진화
OpenAI DALL·E 3 발표: ChatGPT와 통합으로 이미지 생성 AI의 진화
2023.09.22최근 몇 년 동안 AI(인공지능) 분야는 빠른 속도로 발전하고 있으며, 그 중심에는 이미지 및 텍스트 생성 기술이 있습니다. 이미지 생성 영역에서는 Midjourney, leonardo.ai, Adobe Firefly와 같은 다양한 플랫폼들이 등장하며 경쟁이 치열해지고 있는데, 이러한 배경 속에서 OpenAI는 이미지 생성 AI 분야의 리더로서의 위치를 더욱 강화하기 위해 DALL·E의 업그레이드 버전인 'DALL·E 3'을 공개했습니다. 기존의 DALL·E 시스템의 성능을 크게 향상하는 동시에, ChatGPT와의 통합을 통해 사용자는 다양한 경험을 할 수 있습니다. 나아가서 사용자는 더욱 간편하게 고품질의 이미지를 생성할 수 있게 만들며, 이미지 생성 기술의 접근성과 활용도를 높이는 중요한 발판이 될 ..
ChatGPT Retrieval Plugin 개발 (3) : 클라우드 배포
ChatGPT Retrieval Plugin 개발 (3) : 클라우드 배포
2023.09.17앞서 'ChatGPT Retrieval Plugin 개발 (1) : 아키텍처와 사전 준비'에서는 Retrieval Plugin의 기본 구조와 필요한 준비 과정에 대해 소개하고 'ChatGPT Retrieval Plugin 개발 (2) : 배포 및 실용 가이드'에서는 실제로 Plugin을 어떻게 활용할 수 있는지에 대한 방법을 알아보았습니다. 이번 3번째 파트에서는 ChatGPT Retrieval Plugin을 DigitalOcean 클라우드 플랫폼에 배포하는 방법을 중점적으로 다루게 됩니다. DigitalOcean 외에도 AWS, Google Cloud Platform, Azure 등 다양한 클라우드 플랫폼이 있지만, 이 글에서는 DigitalOcean을 사용하는 예제로 진행하게 됩니다. DigitalO..