분류 전체보기
간편 심사 서비스
간편 심사 서비스
2023.01.16사람에게 의존한 심사 과정의 불편함과 비효율을 해결하기 위한 솔루션을 개발했습니다. 간편 심사 서비스는 손쉽게 서류를 접수하고 심사/규칙을 설정하여 자동으로 심사하는 간편 심사 서비스입니다. Problem 서류 심사라는 업무는 서류를 일일이 살펴보고 정보를 확인한 뒤 결과를 판단하는 작업으로 많은 기업이 이 작업을 위해 많은 인력과 시간을 소비합니다. 또한 서류의 종류와 양은 증가함에 따라 사람에 의존한 서류 심사는 매우 어려움이 많습니다. (정확도, 속도 등) Solution Rule과 OCR, 공통 API등을 활용하여 문서를 빠르게 분석하고 오류 없이 결과를 만드는 솔루션을 생각했습니다. Concept 개발을 하기 전 Concept을 발사믹 스튜디오 (Balsamiq) 통해 그리고 UI/UX와 기능을..
드림 스튜디오(Dream Studio - Stable Diffusion) 사용기 (사용법)
드림 스튜디오(Dream Studio - Stable Diffusion) 사용기 (사용법)
2023.01.09지난 2022년 8월, 영국의 오픈소스 인공지능 연구회사 스테빌리티 AI(Stability AI)에서 텍스트를 입력하면 그에 맞는 이미지를 생성하는 Stable Diffusion을 오픈소스로 공개하였습니다. 공개된 Stable Diffusion을 이용하여 수많은 기획자와 개발자들이 자신들의 영역에 맞게 다양한 방향으로 확장 개발하였고 깃허브나 유투브를 보더라도 이미 많은 응용사례가 소개되고 있습니다. (곧 Stable Diffusion 소스를 활용한 방법에 대해 소개하는 글을 작성하도록 하겠습니다.) 스테빌리티 AI는 Stable Diffusion 을 이용해 드림 스튜디오(Dream Studio)라는 전문 유료 이미지 생성 서비스를 선보였습니다. 유료지만 가입을 하면 200회 무료 크레딧이 제공되고, 다..
오픈소스 라이선스 (정리)
오픈소스 라이선스 (정리)
2023.01.06라이선스 종류 오픈소스 라이선스를 분류한 기준은 다음과 같습니다. Reciprocal vs Permissive 오픈소스 라이선스를 분류할 때 가장 중요한 기준은 Copyleft 조항이 있는지 여부입니다. Copyleft조항 즉, 배포시 소스코드 제공의무 있는지(Reciprocal) 없는지 (Permissive)로 우선 분류됩니다. 조합저작물 작성 및 타 라이선스 허용 Copyleft 중에서도 타 라이선스를 허용하는지에 따라 Strong Copyleft/ Weak Copyleft로 나눌 수 있습니다. 추가 제약 존재 Copylef가 아닌 라이선스 즉 Permissive 라이선스의 경우,공통 준수사항 외에 추가적인 제약사항이 존재하는지 여부로 나눌 수 있습니다. 추가로, 라이선스의 출현 배경에 따라서 크게 ..
DALL·E2 사용기 (사용법)
DALL·E2 사용기 (사용법)
2023.01.06DALL·E와 DALL·E 2는 입력된 텍스트로부터 이미지를 생성해 주는 기계 학습 모델이며 OpenAI에서 개발하였습니다. 이미지 생성을 위해서 ChatCPT와 같이 GPT모델을 사용하였으며 현재 소스 코드를 공개하지는 않았습니다. 현재 OpenAI 사이트를 통해 이용이 가능합니다. DALL·E 라는 이름은 픽사의 애니메이션 로봇 캐릭터인 월-E와 스페인의 아티스트 살바도르 달리(Salvador Domingo Felipe Jacinto Dalí i Domènech)에서 따온 것이라고 합니다. 2021년에 첫번째 버전이 출시되었고 2022년 4월에 두 번째 버전이 출시되었습니다. DALL·E 는 글로벌 이미지 저작권 판매 사이트인 셔터스톡(Shutterstock)과 파트너십을 맺고 있고 학습에 필요한 이..
GitHub Copilot(깃허브 코파일럿) 사용법 (Pycharm)
GitHub Copilot(깃허브 코파일럿) 사용법 (Pycharm)
2023.01.05Copilot은 Git 저장소 호스팅 지원 웹 서비스로 유명한 GitHub에서 만든 AI 기반 코딩 솔루션입니다. ChatGPT를 이용하여 코드 작성을 해봤다면 잘 아시겠지만, 최근 AI를 통해 코드를 제안하는 서비스의 수준이 매우 놀라울 정도입니다. Copilot는 GitHub가 보유한 수억 라인의 public 코드를 이용하여 훈련해 모델을 만들었으며 OpenAI Codex를 이용하여 개발자에게 실시간으로 코드를 제안합니다. 1. GitHub Copilot 신청 Copilot은 클로즈 베타로 운영되다가 작년(2022년)에 모두가 이용할 수 있도록 공개되었습니다. Copilot을 이용하려면 우선 GitHub 계정이 있어야 합니다. 가격 정책은 월 $10이거나 연 $100이며, 60일은 무료로 이용할 수 ..
Fine tuning GPT3 Model
Fine tuning GPT3 Model
2023.01.041. OpenAI API 키 발급 OpenAI API An API for accessing new AI models developed by OpenAI beta.openai.com OpenAI API 수행을 위해서는 먼저 API Key 발급이 필요합니다. OpenAI 계정이 필요하며 계정이 없다면 계정 생성이 필요합니다. 간단히 Google이나 Microsoft 계정을 연동 할 수 있습니다. 이미 계정이 있다면 로그인 후 진행하시면 됩니다. 로그인이 되었다면 우측 상단 Personal -> [ View API Keys ] 를 클릭합니다. [ + Create new secret key ] 를 클릭하여 API Key를 생성합니다. API key generated 창이 활성화되면 Key 를 반드시 복사하여 ..
Labeling Tool (UTTU)
Labeling Tool (UTTU)
2023.01.03Machine Learning은 Data에 매우 의존적이며 부정확한 Labeling Data는 모델의 성능에 악영향을 줍니다. 그렇기때문에 정확한 Labeling 작업이 매우 중요한데 이 작업은 매우 힘들고 고되며 많은 비용과 시간이 소요됩니다. Machine Learning의 Data 중요성은 이전 글을 참고 하시기 바랍니다. AI 프로젝트를 경험했다면 이 Data의 문제를 잘 알고 계실 겁니다. 저는 높은 품질의 데이터로 빠르고 효율적으로 작업을 완료할 수 있도록 Labeling Tool을 만들었으며 Tool의 이름은 UTTU입니다. UTTU 기능 1. 작업 및 프로젝트 관리 프로젝트별 진행 사항을 관리 할 수 있도록 직관적이고 시각적인 대시보드를 제공하며 각 프로젝트의 작업유형, 진행량, 소요 시간..
문서이해 Solution 개발 (VisionOCR)
문서이해 Solution 개발 (VisionOCR)
2023.01.02OCR (Optical Character Recognition) 이란 기술은 이미지 속에 글자가 어디에 위치해 있는지 찾고 어떤 글자인지를 판별하는 기술입니다. 가족관계증명서, 등본, 사업자등록증, 보험 처리를 위한 의료진단서, 영수증, 주민등록증 촬영을 할 때 우리 주변에서 이 기술이 적용된 사례들을 어렵지 않게 찾아 볼 수 있습니다. 그만큼 실용적이고 중요한 기술입니다. 기업들은 오래전부터 OCR을 주목해왔고 다양한 방식으로 연구개발하며 적용해 왔습니다. 하지만 여전히 OCR이 기업이나 다양한 프로젝트에서 오르내리는 것은 아직 제대로 정착시키지 못했다는 점을 방증하는 것이기도 합니다. 실제 OCR 도입을 원하는 고객을 만나보면 소비자의 기대는 저만치 앞서 나가 있는데 기술이 따라오지 못하는 형국이라고..
Midjourney 사용기 (사용법)
Midjourney 사용기 (사용법)
2022.12.212022년 8월 게임기획자인 제이슨 앨런은 midjourney를 통해 생성한 '스페이스 오페라 극장(Theatre D’opera Spatial)'이란 작품을 출품하여 콜로라도 주립박람회 미술대회에서 디지털 아트 부문 1등을 차지합니다. midjourney는 작성한 텍스트를 이미지로 바꿔주는 인공지능 프로그램입니다. 당시 사람이 개입한 부분은 텍스트 입력과 결과물 선별하는 것 밖에 없는데, 과연 이것을 사람이 그린 예술작품으로 봐야 하냐는 논쟁이 벌어졌습니다. 유사한 인공지능 프로그램으로 Dall-E, Dream by WOMBO, Stable Diffusion, NovelAI 등이 있지만 무료 서비스인 것에 비해 매우 높은 퀄리티의 결과물을 보여줍니다. 사용법 1. Midjourney사이트로 이동합니다. ..
ChatGPT 사용기 (사용법)
ChatGPT 사용기 (사용법)
2022.12.20지난 12월 3일에 영국 인디펜던트 일간지에 "Google is done" 이라는 제목으로 기사가 올라옵니다. 곧 AI와의 대화가 검색을 대체할 것이고 그렇기때문에 구글의 시대는 끝났다라는 이야기 하는 것 같습니다. 이 기사에서 소개하는 대화형 AI 서비스는 세계 최대 AI 연구소인 OpenAI에서 공개한 AI 챗봇의 일종입니다. 먼저 OpenAI는 테슬라의 일론 머스크와 와이콤비네티어 창업자인 샘 알트만, 링크드인 공동창업자인 리드 호프먼 등 IT업계의 거물들이 힘을 합쳐 만든 회사입니다. 2015년 설립된 이후 세계에서 가장 큰 규모의 AI 개발을 진행 중이며 2020년 GPT-3라는 초거대 AI를 발표합니다. 이후 2년도 채 지나지 않아서 전세계 빅테크 기업들(Meta, Microsoft, Deep..
Data Representation (Data Labeling)
Data Representation (Data Labeling)
2022.12.16기계학습, Machine Learning이란 영역은 Data를 활용하여 예측 가능한 알고리즘을 연구하고 구성하는 활동입니다. 그래서 Machine Learning을 위해서는 학습을 위한 Data가 필요하며, 만약 Data가 충분하다면 그 Data를 이용하여 모델 훈련을 하고 모델링을 하는 거죠. 그렇다면 Machine Learning에서 말하는 Data의 형태는 어떻게 생겼을까요? Data는 인공지능이 학습할 수 있는 형태로 가공되어 있어야 합니다. 인공지능에서 말하는 Data는 이미지 내 Object(Person, Animal, Car 등)에 꼭 맞게 Box를 그리거나 점을 연결하여 Label을 달아놓는 방법 등 기계가 이해할 수 있는 방식으로 정답이 있는 형태를 말합니다. 모델 학습을 위해 필요한 D..
Object Detection 정리 (History)
Object Detection 정리 (History)
2022.12.14이미지 내에서 사물을 인식하는 방법에는 다양한 유형이 존재합니다. 그중 Object Detection에 대해 정리를 하려고 합니다. 먼저 내용은 개인적인 경험을 바탕으로 한 매우 주관적인 내용이라는 점을 미리 말씀드립니다. 저는 사실 Object Detection을 처음 접한 것은 2018년이라고 해야 할 것 같습니다. 이미지에서 내가 원하는 영역만 찾으면 좋겠다는 생각은 했지만, Public Dataset이 아닌 내가 원하는 Object를 기준으로 Dataset을 만들고 학습시키는 과정이 처음에는 쉽지 않았습니다. 처음에 R-CNN을 이용하여 개발해보고 "이 결과가 잘 나온 것인가?"라는 의문도 들었던 때도 있었고, YOLO를 개발하기 위해 Darknet Framwork를 설치하고 환경설정을 하면서 꽤..