娇色导航

????

??? ??

Contributing Writer

AI ?? ?? ???? ??···?????? ?? ??? ??

??
2025.08.128?

?? AI ?? ???? ??, ?? ?? ????? ?? ??? ?? ???? ???? ???? ???? ??.

Team or group of men and women standing in circle joining gears holding colorful cogs. Cropped shot. Teamwork, integration, business, education, success concept background
Credit: Studio Romantic / Shutterstock

AI 코딩 도구가 점점 보편화되면서 ‘멀티에이전트 워크플로’라는 새로운 패턴이 부상하고 있다.

멀티에이전트 워크플로란 기획, 코드 구조 설계, 작성, 테스트, 디버깅, 로그 분석, 배포 등 소프트웨어 개발 생명주기(SDLC)의 특정 업무를 수행하기 위해 여러 AI 에이전트를 동시에활용하는 방식을 말한다.

코드 분석 툴 업체 소나(Sonar)의 최고성장책임자(CGO) 해리 왕은 “범용 코딩 에이전트 하나만으로는 충분하지 않다”라며 “백엔드, 보안, 테스트 엔지니어처럼 전문 인력이 있는 인간 팀과 마찬가지로, AI 시스템에도 여러 특화 에이전트가 필요하다”라고 말했다.

에이전트 팀 이끌기

인공지능 코딩 어시스턴트 ‘태브나인(Tabnine)’의 공동 설립자이자 CTO인 에란 야하브는 “높은 역량을 지닌 엔지니어링 팀을 떠올리면 된다”라며 “한 에이전트는 코드를 작성하고, 다른 에이전트는 이를 테스트하며, 세 번째는 문서화나 검증을 수행하고, 네 번째는 보안과 규정 준수를 점검한다”라고 말했다.

멀티에이전트 워크플로에서는 각 에이전트가 자신의 전문 영역에서 능력을 발휘하며, 이는 인간 엔지니어링 팀의 역할 분담과 유사하다. 멀티에이전트 코딩 환경을 제공하는 ‘워프(Warp)’의 설립자이자 CEO인 잭 로이드는 “각 에이전트는 독립 스레드에서 작업하고, 개발자가 전체를 통제하며 작업을 지휘·검토한다”라고 설명했다.

소프트웨어 개발뿐 아니라 테스트 실행, 배포 같은 영역도 에이전트 간 업무 이관이 가능하다. AI 기반 소프트웨어 전달 플랫폼을 제공하는 디지털에이아이(Digital.ai)의 CTO 윙 토는 “코딩은 SDLC의 한 부분일 뿐”이라며 “견고한 멀티에이전트 워크플로는 지속적 전달을 포함해 SDLC 전 과정을 결합해야 한다”라고 전했다.

변화하는 개발자의 일상

개발자 입장에서 멀티에이전트 흐름은 업무를 도메인 특화형 에이전트로 분산시켜 재편한다. 로이드는 “즉시 가동할 수 있는 협력자 팀과 함께 일하는 것과 같다”라고 비유했다.

예를 들어, 새로운 기능을 개발하는 동시에 한 에이전트는 사용자 로그를 요약하고, 다른 에이전트는 반복적인 코드 변경을 처리할 수 있다. 로이드는 “각 에이전트의 진행 상황을 확인하고, 필요하면 결과를 검토하거나 추가 지시를 내릴 수 있다”라며 자신의 팀도 이미 이런 방식으로 일하고 있다고 말했다.

개발자의 현장 경험을 이해하려면 구체적인 사례를 보면 된다.

  • 코드 생성 에이전트가 내부 설계 표준에 맞춘 모듈을 제안한다.
  • 코드 리뷰 에이전트가 위반 사항을 찾아내고 개선안을 제시한다.
  • 출시 전 테스트 에이전트가 엣지 케이스를 발견하고 단위 테스트를 생성한다.

야하브는 “이런 워크플로에서 개발자 검증 없이 변경은 이뤄지지 않는다”며 “인간은 항상 프로세스 안에 포함된다”라고 설명했다. 이는 개발자의 역할을 변화시키지만, 그 중요성을 줄이지는 않는다.

멀티에이전트 워크플로 방식은 다양하다. 개발 생산성 기업 DX의 부CTO 저스틴 로크는 ‘적대적 프롬프트(Adversarial Prompting)’라는 접근법에서 성과를 봤다고 전했다. 이는 동일한 프롬프트를 클로드, 오픈AI, 딥시크 등 여러 모델에 적용한 뒤, 에이전트가 서로의 결과를 비교·비판해 최적의 답을 도출하는 방식이다.

멀티에이전트 활용의 이점

멀티에이전트 코딩 워크플로는 개발 속도를 높이고, 코드 품질을 개선하며, AI 출력과 비즈니스 목표 간의 정합성을 강화한다. 궁극적으로는 시간 절약 효과를 제공한다. 로이드는 “개발자는 반복 작업을 위임하고 문맥 전환을 피함으로써 시간을 절약할 수 있다”며 “이는 제품 출시 속도를 높인다”고 말했다.

이러한 속도 향상은 코드 품질을 유지하면서도 가능하다. 야하브는 “병렬화된 에이전트 워크플로는 품질을 희생하지 않고 수작업 부담을 줄인다”라며 “코드 리뷰, 테스트, 문서화가 모두 더 빨라진다”고 설명했다. 그는 이어 “내부 정책에 자동으로 맞춰주고, AI가 의사결정 이유를 설명하는 과정을 통해 오히려 코드 품질과 가독성이 향상될 수 있다”라고 덧붙였다.

로크는 멀티에이전트의 장점이 효율성과 정확성 모두에 있다고 봤다. 이는 주로 모델 특화 능력에서 기인한다. 예를 들어, 깃허브 코파일럿은 타입스크립트에 강하고, 미스트랄은 파이썬에 더 적합하다고 로크는 설명했다.

오케스트레이션의 필요성

현재 멀티에이전트 프로세스는 여전히 초기 단계에 있다. 윙 토는 “이 분야는 아직 걸음마 단계”라며, 개발자들이 생성형 AI를 작업에 도입하고 있지만 멀티에이전트 활용은 대부분 수동으로 순차 구성하는 수준이라고 전했다.

로크는 앞서 언급한 ‘적대적 프롬프트’ 패턴에도 많은 수작업이 필요하다고 인정했다. 에이전트별로 시스템 프롬프트를 업데이트하고 보안 가드레일을 추가하는 과정은 중복 작업을 야기한다. 따라서 에이전트 간 연계 과정을 자동화하는 오케스트레이션이 생산성 측면에서 순이익을 내기 위해 필수적이다. 그렇지 않으면 여러 채팅 UI와 IDE를 오가며 프롬프트와 출력을 복사·붙여넣는 일이 오히려 효율을 떨어뜨릴 수 있다.

야하브는 “오케스트레이션이 없으면 멀티에이전트 시스템은 혼란에 빠진다”며 “중복, 불일치, 심지어 상충되는 결과까지 나올 수 있다”고 지적했다. 그는 이러한 워크플로가 분리된 플러그인을 단일 아키텍처로 통합하고, 정책 기반 거버넌스를 통해 에이전트의 행동을 규정해야 한다고 강조했다.

또한 사용자에게는 에이전트의 동작을 들여다볼 수 있는 ‘가시성’이 필요하다. 로이드는 “핵심은 가시성과 통제”라며 “개발자는 각 에이전트가 무엇을 하고 있는지, 진행 상황이 어느 정도인지 확인할 수 있어야 하고, 에이전트는 언제 어떤 방식으로 도움을 요청할지 알아야 한다”고 말했다.

가시성은 양방향이어야 한다. 에이전트가 내부 표준에 맞춰 작업하도록 ‘공유 지식 베이스’를 구축하는 것도 중요하다. 여기에 코딩 규칙, 환경 변수, 일반적인 문제 해결 절차 등을 포함해야 한다. 로이드는 “이렇게 하면 에이전트가 팀의 작업 방식에 맞춰지고 예기치 못한 결과를 줄일 수 있다”고 덧붙였다.

왕 역시 지식 베이스의 중요성에 동의했다. 그는 “애플리케이션 요구사항, 설계, 코드 표준에 대한 근본적인 기준이 없으면, 에이전트가 국지적으로는 타당하지만 전체적으로는 치명적인 변경을 할 수 있다”고 경고했다.

토는 “멀티에이전트 워크플로를 효과적으로 활용하려면 에이전트 AI 오케스트레이션이 필수”라며, 에이전트 사용 승인, 반복 가능한 가이드라인 설정, 행동 감사 등과 같은 까다로운 요구사항이 있으며, 이를 개선된 오케스트레이션이 해결할 수 있다고 말했다.

가드레일과 감사 추적

멀티에이전트 워크플로는 특히 무감독 자율성과 관련해 위험을 수반한다. 이를 해결하려면 에이전트가 수행할 수 있는 작업에 대해 세밀한 권한을 부여하고, 행동 범위를 제한하는 가드레일을 설정해야 한다.

적절한 감독 없이 AI 에이전트를 방치하면 데이터 유출 위험이 커진다. 야하브는 “에이전트가 외부 API나 클라우드 추론에 의존할 경우, 프롬프트에 지적 재산이나 규제 대상 데이터가 포함될 수 있다”고 경고했다. 이 밖에도 변경 사항에 대한 감사 불가능, 내부 표준을 무시한 코드 작성, 기술 부채 유발 등의 문제가 발생할 수 있다.

로이드는 “팀은 에이전트 권한, 로컬 실행, 투명한 로그, 데이터 공유 및 AI 설정에 대한 완전한 통제권을 확보해야 한다”고 말했다. 그는 또한 개발자가 AI가 생성한 모든 코드를 직접 검토해 품질 기준을 유지해야 한다고 강조했다.

야하브는 AI 에이전트 보안 문제를 완화하기 위해 규제 환경에서는 폐쇄망 또는 온프레미스 배포를 권장했다. 또한 AI 상호작용에 대한 감사 추적을 만들고, 활성 에이전트에 대해 런타임 정책 집행을 적용할 것을 조언했다.

그러나 에이전트 성능이 기대에 미치지 못할 가능성은 여전히 존재한다. 왕은 “오늘날 멀티에이전트 AI 시스템은 재능은 있지만 감독받지 않는 신입 팀과 같다”며 “단일 작업에서는 인상적인 성과를 낼 수 있지만, 견고하고 고품질의 애플리케이션을 만들기 위한 결속력과 아키텍처적 감독이 부족하다”라고 말했다.

왕은 최근 인기 있는 코드 작성 툴을 사용하다가, 에이전트가 작업 도중 라이브러리를 전환하지 못해 진행이 막힌 경험을 공유했다. 이 외에도 AI 에이전트에 대한 불만은 애플리케이션을 깨뜨리는 코드 변경, 문제를 간과하는 스캐너, 무단 명령 실행, 파일·데이터베이스 삭제 등 다양하다.

또한 컨텍스트 윈도우 제한과 상태를 유지하지 않는 에이전트의 특성 때문에, 특히 여러 단계를 거치는 개발 워크플로에서는 에이전트 간 메모리 공유가 어렵다.

멀티에이전트 함정 피하기

전문가들은 멀티에이전트 워크플로 도입 시 다음과 같은 실질적인 팁을 제시한다.

  • 공통 지식 베이스 확보: 사람과 기계가 모두 이해할 수 있는 코딩 규칙, 시스템 변수, 내부 기준서 마련
  • 인간 검증 유지: 에이전트는 예측 불가능한 행동을 할 수 있으므로, 모든 AI 생성 코드는 사람이 검토
  • 전문화: 멀티에이전트 프로세스에는 범용 에이전트보다 목적 특화형 에이전트를 활용
  • 소규모 시작: 자동화 이점이 명확한, 익숙한 과제부터 시험 적용 후 확장
  • 성과 지표 설정: 다른 소프트웨어 활동과 동일하게 멀티에이전트 시스템의 성능을 측정
  • 통합 아키텍처 구축: 에이전트 간 권한, 거버넌스, 컨텍스트 지식 적용 방식 고려

로크는 대형 온라인 리테일러와 대형 금융 기업의 실제 에이전트 도입 사례를 언급하며, 이들이 잘한 점은 ‘행동을 최종 가치와 연결한 것’이라고 말했다. 그는 “현재 가치 흐름을 살펴보고, 특정 유형의 에이전트가 해당 영역의 마찰을 줄이거나 확장할 수 있는지 자문하라. 가능하다면 모델을 구축해 워크플로에 통합하라”고 조언했다.

진화 중인 멀티에이전트 툴

전용 멀티에이전트 코딩 플랫폼은 내장된 거버넌스, 공유 컨텍스트 엔진, 인간 검증(Human-in-the-loop) 제어 기능을 갖춰 빠른 도입을 가능하게 한다. 그러나 이 분야는 이제 막 시작된 단계로, 소프트웨어 개발을 위한 에이전트 툴킷은 아직 초기 개발·진화 과정에 있다.

대표적인 예로, 터미널 기반 AI 코딩 툴인 클로드 코드는 에이전트를 생성·관리할 수 있다. 루 코드(Roo Code)는 비주얼 스튜디오 코드(Visual Studio Code)용 에이전트형 코딩 어시스턴트로, 범용 코드 모드, 설계·기획을 위한 아키텍트 모드, 진단·문제 해결용 디버그 모드, 그리고 특화 모드에 작업을 위임하는 오케스트레이터 모드 등 다중 작업 특화 모드를 제공한다. 워프는 여러 에이전트를 병렬로 실행하고 작업을 모니터링할 수 있는 터미널 기반 개발 환경이다.

더 하위 레벨에서는 대규모 언어 모델(LLM) 오케스트레이션을 지원하는 패키지가 속속 등장하고 있다. 랭체인(LangChain), 라마인덱스(LlamaIndex), 헤이스택(Haystack) 같은 프레임워크는 LLM과 툴, 데이터 소스를 결합한 워크플로 구축을 쉽게 해준다. 그러나 에이전트와 멀티에이전트 오케스트레이션은 비교적 최근에 포함된 기능이다. 멀티에이전트 애플리케이션 제작용 툴킷인 오토젠(AutoGen) 역시 이제 막 등장하기 시작했다.

내부적으로는 MCP(Model Context Protocol), A2A(Agent2Agent) 같은 새로운 에이전트 메시 및 AI 프로토콜이 소프트웨어 개발 환경뿐 아니라 다양한 영역에서 에이전트를 연결하는 핵심 역할을 할 것으로 예상된다.

멀티에이전트, 가능성과 과제

여러 AI 에이전트를 동시에 활용하면 상당한 가능성이 열린다. 야하브는 “AI 에이전트는 시니어 엔지니어의 지식을 코드화해 보편적으로 적용할 수 있다”라고 말했다.

토는 앞으로 개발자가 다양한 에이전트를 통해 하위 세부 작업을 처리하게 되면, 오류를 줄이고 인지 부담을 완화하면서 생산성이 향상될 것으로 내다봤다. 그는 “이 분야가 성숙하면 멀티에이전트 워크플로가 반복 작업을 크게 줄여 개발 속도를 높일 것”이라고 전망했다.

다만, 이를 성공적으로 구현하려면 제품 요구사항, 코딩 표준, 보안 정책 등에 대한 명확한 경계 설정이 필요하다. 왕은 “에이전트 기반 SDLC는 고성능 인간 팀과 동일한 세 가지 핵심 요소 즉 명확한 미션, 행동 규범, 공유 지식가 필요하다”고 말했다.

따라서 개발자가 다수의 에이전트를 관리하는 미래로 향하고 있지만, 초기 도입자는 상당한 시행착오를 감수해야 한다. 로크는 이를 두고 “실패를 각오하라. 아직 완성된 기술이 아니다”라고 표현했다.
dl-ciokorea@foundryco.com

Contributing Writer

Bill is a tech journalist specializing in state-of-the-art technologies in the enterprise cloud software space. He is also , a knowledge center for API practitioners, and contributes to , (formerly Container Journal), and Acceleration Economy.

Bill is originally from Seattle, where he attended the University of Washington. He now lives and works in Portland, Maine.

? ??? ?? ???