Groq
간단한 RAG(Retrieval-Augmented Generation) 프로그램 만들기 (Python)
간단한 RAG(Retrieval-Augmented Generation) 프로그램 만들기 (Python)
2024.08.15인공지능 기술의 발전으로 대규모 언어 모델(LLM) 이 놀라운 성능을 보여주고 있지만, 여전히 최신 정보 반영이나 특정 도메인 지식 활용에 한계가 있습니다. 이러한 문제를 해결하기 위해 등장한 기술이 바로 RAG(Retrieval-Augmented Generation)입니다. RAG는 '검색 증강 생성'이라고 번역할 수 있으며, LLM의 광범위한 일반 지식과 외부 데이터베이스의 특정 정보를 결합하여 더 정확하고 맥락에 맞는 응답을 생성하는 AI 기술입니다. 이 기술은 최신 정보 반영, 특정 도메인 지식 보강, 환각(Hallucination) 문제 감소 등의 장점을 제공합니다.이 글에서는 RAG의 기본 원리를 이해하고 테스트해 볼 수 있는 간단한 RAG 프로그램을 만들어보겠습니다. 우리가 만들 프로그램은..
다양한 LLM을 이용한 웹 테스트 자동화 (LaVague) - Python
다양한 LLM을 이용한 웹 테스트 자동화 (LaVague) - Python
2024.03.23현대 비즈니스 환경에서 테스트 자동화는 소프트웨어 개발 과정의 핵심 요소로 자리 잡았습니다. 많은 기업들이 효율성과 정확성을 높이기 위해 다양한 테스트 자동화 도구를 도입해 왔습니다. 그러나 기존 개발 방식과 레거시 코드의 복잡성은 자동화 테스트의 적용을 어렵게 만들었습니다. 과거의 규정과 업무 변화에 급히 대응하며 추가된 예외 로직은 코드를 복잡하게 만들었고, 이로 인해 단위 테스트가 사실상 불가능해지는 상황에 이르렀습니다. Ui-Path나 Auto Anywhere와 같은 솔루션을 활용하는 시도도 있었지만, 이러한 도구들 역시 한계에 직면했습니다. 또한, Selenium을 이용한 자동화 접근 방식은 HTML 구조와 DOM에 대한 깊은 이해를 요구하며, 개발자에게 상당한 어려움을 줍니다. 개발자들은 더 ..
Groq 플랫폼 사용 가이드: AI 모델 처리 속도 혁신
Groq 플랫폼 사용 가이드: AI 모델 처리 속도 혁신
2024.03.03AI와 머신러닝의 세계는 매일 혁신으로 넘쳐나지만, 때때로 기존의 패러다임을 근본적으로 전환시키는 혁신이 등장합니다. Groq의 최근 발표는 바로 그러한 혁신적 순간 중 하나입니다. Groq는 Meta AI의 Llama-2 70B 모델을 이용해 사용자당 초당 300 토큰을 처리하는 놀라운 성과를 달성했습니다. 이는 단순한 기록 경신을 넘어서, AI 분야에서 속도와 효율성의 새로운 장을 열었습니다. Groq는 2016년 Jonathan Ross에 의해 설립되었으며, Ross는 구글에서 Tensor Processing Unit (TPU) 프로젝트에 참여하며 AI 처리를 위한 전용 하드웨어의 중요성을 깊이 인식하게 되었습니다. TPU의 개발은 딥러닝 알고리즘을 더욱 빠르고 효율적으로 실행할 수 있게 하며, R..