뉴스레터 I-ON Communications의 다양한 소식들을 확인해보세요.

RAG(Retrieval-Augmented Generation)란?검색 증강 생성 알아보기!

  • 등록일 2025년06월19일

본문

안녕하세요, 아이온커뮤니케이션즈 입니다.

생성형 AI가 빠르게 발전하면서 더 정확하고 신뢰할 수 있는 답변을 만드는 기술에 대한 관심이 날로 높아지고 있습니다.

그중에서도 최근 주목받는 기술이 바로 RAG (Retrieval-Augmented Generation)입니다.

오늘은 이 RAG에 대해 알아보도록 하겠습니다!


RAG는 무엇일까요?

출처 : 게티이미지뱅크

RAG는 Retrieval-Augmented Generation의 줄임말로 한국어로는 검색 증강 생성이라고도 하며,

대규모 언어 모델(LLM)에 검색 기능​을 결합한 기술을 뜻합니다.

여기서 LLM은 Large Language Model의 약자로,

방대한 양의 텍스트 데이터를 학습해 사람처럼 자연스러운 문장을 이해하고 생성할 수 있는 AI 모델을 말합니다.

대표적으로 ChatGPT 같은 챗봇이 LLM에 해당됩니다.

LLM은 방대한 데이터를 바탕으로 답변을 만들지만, 학습하지 않은 정보에 대해서는 부정확하거나 엉뚱한 내용을 만들어내기도 합니다. 이런 현상을 ‘AI 환각현상(할루시네이션)’이라고 부르며, RAG는 외부에서 신뢰할 수 있는 정보를 찾아와 이 문제를 줄이기 위해 고안된 기술입니다.


RAG는 왜 필요할까요?

출처 : 게티이미지뱅크

아무리 성능이 뛰어난 LLM이라도, 학습한 데이터에 포함되지 않은 정보나 최신 이슈에 대해서는 정확한 답변을 제공하기 어렵습니다. LLM은 인터넷상의 방대한 텍스트를 기반으로 학습되지만, 실시간 정보가 아닌 특정 시점까지 수집된 정적인 정보를 통해 학습됩니다.

따라서 실시간 변화가 많은 정보에는 대응이 불가능하며, 결과적으로 그럴듯하지만 틀린 답을 지어내는 ‘AI 환각현상(할루시네이션)’이 자주 발생합니다.

이런 한계를 극복하기 위해 필요한 것이 바로 RAG입니다.

RAG는 AI가 질문을 받았을 때, 과거에 학습한 내용만 가지고 답하는 것이 아니라,

외부 지식 저장소나 검색 시스템을 활용해 관련 문서를 실시간으로 찾습니다.

그런 다음 이 문서들을 바탕으로 LLM이 문장을 생성하기 때문에, 보다 정확하고 근거 있는 답변을 만들 수 있습니다.

결과적으로 사용자 신뢰도를 높이고, 기업이 AI를 실무에 적극 활용할 수 있는 환경을 만들어줍니다.


RAG의 동작원리

출처 : ChatGPT

RAG는 기본적으로 검색과 생성을 통해 작동합니다.

먼저 사용자가 질문을 하면, AI는 질문의 핵심 키워드를 파악해 외부 지식 저장소나 데이터베이스에서 관련 자료를 찾아옵니다.

이때 일반적인 검색엔진처럼 정확도와 연관성이 높은 문서를 우선적으로 선택합니다.

그다음 단계는 생성입니다. 검색해온 문서나 문장들을 토대로 LLM이 답변을 만들어냅니다.

즉, AI가 스스로만 상상해서 문장을 만들지 않고,

실제 근거가 되는 정보를 기반으로 문장을 완성합니다.

이 과정을 통해 AI는 최신 정보나 신뢰성 높은 데이터를 즉시 참고할 수 있어,

잘못된 내용을 지어내는 할루시네이션 문제를 줄이고 정확도를 높입니다.

RAG는 이렇게 검색과 생성을 동시에 수행하면서 기존 LLM의 한계를 보완하는 역할을 합니다.


RAG의 장점과 단점

출처 : 게티이미지뱅크

오늘은 RAG의 개념부터 필요성, 동작원리, 장단점까지 간단히 정리해봤습니다!

앞으로 더 많은 AI 서비스에서 RAG가 핵심 기술로 활용될 것으로 예상되는데요.

AI를 활용하거나 관심 있는 분들이라면 꼭 알아두면 좋겠습니다😊 감사합니다.