Insights/IT Trends
Data Representation (Data Labeling)
Data Representation (Data Labeling)
2022.12.16기계학습, Machine Learning이란 영역은 Data를 활용하여 예측 가능한 알고리즘을 연구하고 구성하는 활동입니다. 그래서 Machine Learning을 위해서는 학습을 위한 Data가 필요하며, 만약 Data가 충분하다면 그 Data를 이용하여 모델 훈련을 하고 모델링을 하는 거죠. 그렇다면 Machine Learning에서 말하는 Data의 형태는 어떻게 생겼을까요? Data는 인공지능이 학습할 수 있는 형태로 가공되어 있어야 합니다. 인공지능에서 말하는 Data는 이미지 내 Object(Person, Animal, Car 등)에 꼭 맞게 Box를 그리거나 점을 연결하여 Label을 달아놓는 방법 등 기계가 이해할 수 있는 방식으로 정답이 있는 형태를 말합니다. 모델 학습을 위해 필요한 D..
Open Source
Open Source
2021.01.29오픈소스는 셰프가 자신만이 알고 있는 비법이 담긴 레시피와 만드는 과정을 그대로 공개하는 것이라고 할 수 있습니다. 이렇게 소스코드는 매우 중요한데 수많은 개발자가 공개하는 이유는 무엇일까? Closed Source 오픈소스 소프트웨어의 반대되는 용어는 클로즈드소스(Closed Source) 소프트웨어로, 특정 기업의 소유라는 뜻에서 ‘사유 소프트웨어’라고도 합니다. 대표적인 클로즈드소스 소프트웨어가 바로 윈도우 입니다. 클로즈드소스 소프트웨어는 사용자에게 단지 사용할 권리만을 제공하고 소스코드는 공개되지 않지만 반면에 오픈소스는 누구든지 소스코드를 열람할 수 있을 뿐만 아니라 사용조건에 따라 수정하고 배포할 수 있습니다. Contribute 공개된 소스코드의 열람을 통해 많은 사람이 이를 연구하면서 오..
Machine Learning
Machine Learning
2021.01.29머신러닝이란 데이터를 분석/학습 한 정보를 기반으로 예측이나 결정을 하기 위해 적용하는 알고리즘이라고 할 수 있습니다. 머신러닝과 유사한 의미의 용어로 AI, 딥러닝, 데이터마이닝, 패턴인식, 통계학 등도 사용되고 있는데 관련 전공자가 아니면 무슨 차이가 있는지 알기 어렵고, 또 무엇이 다른지 쉽게 이해가 되지 않습니다. 결론적으로는 약간의 차이는 있으나 교집합이 매우 큰 거의 유사한 의미라고 생각하면 됩니다. 비슷한 의미이지만 여러 용어가 사용하는 이유는 과학이나 기술분야도 이전과 큰 차이가 없으면서도 의도적으로 새로운 용어를 만들어서 좀 더 트렌디하게 보이고 좀 더 잘 팔리게 하려는 전략적인 목적이 있습니다. 데이타의 시대 스마트 폰은 우리의 위치와 패턴을 시시각각 기록하고 웹사이트는 모든 사용자의 ..
Digital Transformation(DT) 알아보기
Digital Transformation(DT) 알아보기
2021.01.293년간의 대형 프로젝트를 마쳤을때 (2017년) 회사 내에서는 DT라는 생소한 용어가 사용되고 모든 프로젝트나 추진예정인 과제에는 유행처럼 DT라는 말을 포함하게 되었습니다. DT는 새로운 트랜드인 Digital Transformation의 약자입니다. 하지만 그 의미가 쉽게 이해 되지 않으며 주변을 보면 많은 사람들이 자의적으로 해석하여 사용하고 있습니다. Digital Transformation의 의미 먼저 디지털(Digital)의 의미를 알아야 합니다. 우리는 디지털의 의미를 Digitization과 Digitalization을 혼용하여 사용하곤 합니다. 하지만 이 두 단어는 관련이 있지만 별개의 개념이며 큰 차이가 있습니다. Digitization은 아날로그(Analog) 기록을 디지털 데이터로 ..
OCR Solution 개발 (Python)
OCR Solution 개발 (Python)
2021.01.29OCR은 입력, 손글씨 또는 인쇄 된 이미지 형태의 텍스트를 조작 할 수있는 기계 인코딩 텍스트 데이터로 치환하는 것입니다. 최근 AI, 자동화(RPA 등) 도입으로 많은 관심을 받고 있습니다. OCR의 품질 OCR에 대한 관심이 높아지면서 연구와 투자가 활발해지면서 인식률이 많이 올라간 상황이지만 여전히 OCR에서 한글의 인식률은 매우 저조합니다. 영어의 경우 글자의 수는 26자(A, B, C….)이지만 한글의 경우 완성형으로 2,350자, 조합형으로는 11,172자이니 학습의 양이 많을 뿐 아니라 결과 또한 오인식 될 확률이 높기 때문입니다. 한 줄로 쓰는 영어, 서유럽 언어와는 달리 받침이 존재하고 문자 모양이 복잡한 한글의 경우는 이미지 조금만 틀어져도 두 줄로 인식될 수 있어 한글의 인식률은 매..