LLM 솔루션 활용 및 환각현상 방지 연구 개발
관련링크
본문
최근 몇 년간, 대규모 언어 모델(Large Language Models, LLM)은 자연어 처리 분야를 넘어 다양한 산업 분야에서 혁신을 주도하는 핵심 기술로 부상했다. LLM은 웹·문서·코드 등 방대한 텍스트를 바탕으로 “다음에 올 말을 맞히는 방식”으로 언어 패턴을 익히는 대규모 트랜스포머(Transformer) 기반 모델이다. 토큰 단위로 문장을 읽으며 멀티헤드 어텐션(attention)으로 문맥 속 중요한 단서를 골라 보고, 그렇게 축적된 통계적 규칙과 상식을 활용해 자연스러운 문장을 이어 쓴다. 학습 뒤에는 사람이 준 예시 대화로 추가 미세조정하고(RLHF·SFT 등), 필요하면 검색결합(RAG)이나 도구 호출을 붙여 최신 정보와 정확성을 보강한다. 모델의 크기를 키울수록 일반적으로 성능이 좋아지는 경향이 있고, 요약·번역·코딩·질의응답 등 다양한 작업에 범용적으로 쓰인다. 인간과 유사한 수준의 텍스트를 이해하고 생성하는 능력 덕분에 챗봇, 콘텐츠 제작, 정보 검색 등 무한한 활용 가능성을 보여주고 있다. 하지만 LLM이 대중화되면서 몇 가지 중대한 기술적 한계점 또한 명확해졌다. 대표적으로, 모델이 학습하지 않은 최신 정보나 특정 분야의 전문 용어(신조어, 고유명사)를 정확히 처리하지 못하는 문제와 사실에 근거하지 않은 그럴듯한 거짓 정보를 생성하는 환각(Hallucination) 현상이 있다. 더 나아가, 사용자의 복잡한 요구사항을 여러 단계에 걸쳐 체계적으로 수행하고 관리하는 능력 또한 아직 초기 단계에 머물러 있다.
본 연구실에서는 이러한 기술적 난제를 해결하고 LLM의 신뢰성과 활용성을 극대화하기 위해 다음과 같은 연구를 수행하고 있다. LLM이 최신 정보를 신속하게 학습하고, 생성된 정보의 사실성을 스스로 검증하며, 복잡한 다중 업무를 자율적으로 처리할 수 있는 차세대 지능형 시스템 개발을 목표로 한다.
● Private LLM 을 통한 신조어·고유어 추출 모듈 개발
본 연구에서는 LLM의 환각 현상을 방지하고, 고유어에 대한 처리 능력을 향상시키는 기술을 개발한다. 이를 위해 ‘Self-Instruction’ 기법으로 고유어 데이터셋을 자동으로 구축하고, 이를 학습한 Private LLM을 통해 고유어를 정확히 추출하는 모듈을 개발한다. 또한, 답변을 생성하는 LLM과 이를 검증하는 LLM으로 구성된 2단계 검증 기법을 연구하여, LLM이 생성하는 답변의 신뢰도를 획기적으로 높이는 것을 목표로 한다.
고유어 추출 모듈을 개발하기 위해, 위키 백과, 뉴스, 특허 자료 등에서 텍스트를 수집하여 10만 개 규모의 ‘텍스트-고유어’ 쌍 학습 데이터셋을 구축했다. 구축된 데이터셋을 활용하여, LLAMA 2-7B 기반의 한국어 모델인 KoSoLAR-10.7B를 LoRA(Low-rank Adaptation) 기법으로 미세조정했다. 또한, 환각 현상을 방지하기 위해 ‘Self-evaluation(자기검증)’ 구조를 적용한 2단계 검증 기법을 개발했다. 이 기법은 '질문 검증 LLM'이 먼저 사용자의 질문에 포함된 오류를 수정하고, 답변이 생성된 후에는 '답변 검증 LLM'이 그 내용을 다시 한번 확인함으로써 정보의 정확성과 신뢰도를 확보한다.
그림 1 LLM솔류션 활용 및 환각현상 방지 연구개발 개념도
● 계층적 AI 에이전트 기반 다중 업무 질의응답 서비스 체계 정의
복잡한 다중 업무를 효과적으로 처리할 수 있는 계층적 AI 에이전트 기반의 서비스 프레임워크를 개발한다. 사용자의 요구사항을 하위 작업으로 자동 분해하는 작업 스케줄링 기법을 연구하고, 각기 다른 전문성을 가진 하위 AI 에이전트들이 계층적 구조 안에서 주어진 업무를 협력적으로 수행하는 서비스 체계를 연구한다. 이를 통해 여러 AI 에이전트의 능력을 유기적으로 결합하여 다중 업무에 대한 신뢰성 높은 결과물을 도출하는 것을 목표로 한다.
본 연구에서는 프롬프트 엔지니어링을 핵심 기술로 활용한다. 이를 통해 상위 AI 에이전트는 사용자의 복합적인 질문을 분석하여 최적의 작업 계획을 수립하고, 각 하위 AI 에이전트에게 역할과 처리 순서가 명시된 맞춤형 프롬프트를 전달하여 전체 작업을 체계적으로 관리한다. 또한, 최종 답변을 생성하는 과정에서는 사전에 정의된 답변 규칙이 포함된 프롬프트를 사용하여 일관되고 신뢰성 높은 결과물을 사용자에게 제공한다.
그림 2 계층적 AI 에이전트 기반 다중 업무 질의응답 서비스 연구개발 개념도