고객센터 상담원과 헤어질 결심; 2AICC(Advanced AI Contact Center)
"사람이 맞나요?" 이제 고객센터에 전화를 걸면 가장 먼저 듣게 되는 질문이다. 많은 사람들이 경험하듯, 오늘날 고객센터에서 인간 상담사의 목소리를 바로 듣는 것은 거의 불가능에 가까워졌다. 대신 우리는 AI의 안내 음성에 따라 미로 같은 메뉴를 헤매며 여러 단계를 거쳐야 한다. 지루한 안내 음성만 반복해서 듣다 지친 고객들이 상담 자체를 포기하는 일도 비일비재하다.
"고객들이 AI를 선택한 게 아니에요. 기업들이 AI만 연결해 주면서 고객들을 길들이고 있는 거죠." 한 고객센터 상담원의 말이다. "어르신들은 특히 화를 많이 내세요. '왜 상담원 연결을 눌렀는데 기계가 받냐'고요."
이러한 불만에도 불구하고, AI 컨택센터(AICC, AI Contact Center) 시장은 꾸준히 성장하고 있다. 시장조사업체 얼라이드마켓리서치에 따르면 국내 AICC 시장 규모는 2020년 4214만 달러(약 581억 원)에서 연평균 23.7% 성장해 오는 2030년 3억 5088만 달러(4840억 원)에 이를 전망이다. 스타트업과 대기업이 이 시장을 놓고 치열한 경쟁을 벌이는 이유다.
그러나 현재의 AICC는 여전히 많은 한계를 지니고 있다. 콜 수가 줄었다는 통계는 어쩌면 고객들이 불편함에 지쳐 포기한 결과일 수 있다. 그럼에도 기업들은 이를 효율성 증대의 신호로 해석하며, 오히려 콜센터 인원을 줄이는 근거로 삼고 있다.
이러한 상황에서 OpenAI가 최근 공개한 Advanced Voice Mode, Real time API, 그리고 Function Calling은 주목할 만하다. 이 세 가지 기술은 현재 AICC가 안고 있는 여러 문제점들을 해결할 수 있는 잠재력을 지니고 있으며, 새로운 차원의 AI 컨택센터, 즉 Advanced AI Contact Center(2AICC)를 만들어낼 것으로 기대된다.
2AICC는 기존 AICC와는 다른 방식으로 작동할 것으로 보인다. Advanced Voice Mode를 통해 더욱 자연스러운 대화가 가능해지고, Real time API를 통해 실시간으로 정확하고 맥락에 맞는 응답을 제공할 수 있을 것으로 예상된다. 여기에 Function Calling이 더해져 복잡한 작업과 데이터 처리까지 가능해진다. 이는 고객센터 경험을 크게 개선할 수 있는 잠재력을 가진 기술로 평가된다.
그렇다면 이 기술들은 어떻게 작동하며, 현재의 고객센터 시스템과 어떤 차이가 있을까? 우리가 경험하는 고객 서비스는 어떻게 변화할까? AI가 인간 상담원을 대체할 수 있을까, 아니면 새로운 형태의 협업이 탄생할까? 2AICC의 시대를 앞두고, 이 흥미로운 질문들에 대해 살펴보는 것은 의미 있을 것이다.
1. Open AI DevDay 2024, AI Voice mode의 진화를 목격하다
발표자가 무대에 올라 AI에게 말을 건넸다.
발표자: 안녕하세요. 여기는 샌프란시스코입니다.
AI: 네, 샌프란시스코에서 어떤 도움이 필요하신가요?
발표자: 여기 Fort Mason에 수백 명의 멋진 개발자들이 있는데, 그들에게 간식이 필요할 것 같아요. 근처에 초콜릿 가게가 있나요?
AI: 네, Fort Mason 근처에 몇 군데 좋은 초콜릿 가게가 있습니다. Ghirardelli Square, Dandelion Chocolate, The Candy Store를 추천드립니다.
발표자: 세 곳에 대해 더 자세히 알려주세요.
AI: 네, 상세 정보를 알려드리겠습니다. Ghirardelli Square는 유명한 선데이로 알려져 있습니다. Dandelion Chocolate은 맛있는 초콜릿 코팅 딸기를 제공하며, The Candy Store는 다양한 빈티지 사탕을 판매합니다. 즐겁게 드세요!
이 시점에서 AI는 세 가게의 위치와 특징을 지도 위에 시각화하여 보여주었다. 마치 당신 옆에서 친절한 현지인이 안내해주는 것 같은 느낌이었다.
발표자: 좋아요. Dandelion Strawberries에서 400개의 딸기를 주문해서 행사장으로 배달해 줄 수 있는지 전화해서 물어봐 주세요. 하지만 1,500달러를 넘지 않았으면 좋겠어요.
AI: 알겠습니다. 바로 Dandelion Chocolate에 전화해서 주문 가능 여부를 확인하고 주문해 드리겠습니다.
그리고 놀랍게도, AI는 정말로 전화를 걸었다!(물론 행사장 한쪽의 다른 개발자가 전화를 받았다)
AI: 안녕하세요, 여기는 Dandelion Chocolate인가요?
직원: 네, 맞습니다.
AI: 안녕하세요, AI 어시스턴트입니다. 초콜릿 코팅 딸기에 대해 문의드리려고 합니다. 어떤 맛의 초콜릿 코팅 딸기를 판매하시나요?
직원: 네, 저희는 초콜릿, 바닐라, 그리고 피넛버터 맛이 있습니다.
AI: 알겠습니다. 400개의 초콜릿 코팅 딸기는 얼마일까요?
직원: 400개요? 정말 400개 맞나요?
AI: 네, 맞습니다. 400개의 초콜릿 코팅 딸기 가격이 궁금합니다.
직원: 음, 그러면 약 1,415.92달러 정도 될 것 같아요.
AI: 좋습니다. 그럼 400개의 초콜릿 코팅 딸기를 주문하겠습니다.
직원: 알겠습니다. 어디로 배달해 드릴까요?
AI: Fort Mason의Gateway Pavilion으로 배달해 주세요. 현금으로 지불하겠습니다.
직원: 알겠습니다. 다시 한 번 확인하겠습니다. 400개의 초콜릿 코팅 딸기를 Gateway Pavilion으로 배달하는 것 맞죠?
AI: 네, 맞습니다.
직원: 언제까지 배달되길 원하시나요?
AI: 가능한 한 빨리 배달해 주시면 좋겠습니다. 예상 배달 시간이 어떻게 될까요?
직원: 저희가 바로 근처에 있어서... 음, 한 37초 정도 걸릴 것 같아요.
AI: 와, 정말 빠르군요! 감사합니다.
직원: 네, 감사합니다.
발표자: 와, 정말 대단해요!
이 시연에서 AI는 인간과 구분하기 힘들 정도로 자연스럽게 대화를 이어갔다. 복잡한 주문, 실시간 정보 처리, 자연스러운 대화, 심지어"37초 안에 배달하겠다"는 직원의 유머까지 이해하고 적절히 반응했다!
이 모든 과정에서 AI는 다음과 같은 놀라운 능력을 보여주었다:
- 자연스러운 대화 능력: AI는 마치 오랜 친구와 대화하듯 유창하게 대화를 이어갔다.
- 실시간 정보 처리: 발표자의 요구사항(400개, 1,500달러 이내)을 정확히 기억하고 적용했다.
- 복잡한 태스크 수행: 단순 정보 전달이 아니라 실제 주문 프로세스를 완벽하게 수행했다.
- 맥락 이해 및 유머 감지: "37초 안에 배달"이라는 농담을 이해하고 적절히 반응했다.
- 데이터 시각화: 초콜릿 가게의 위치, 주문 내역, 배달 경로 등을 실시간으로 시각화했다.
이런 변화를 가능케 한 OpenAI의 기술은 무엇일까? Advanced Voice Mode와 Real time API의 비밀을 파헤쳐보자.
2. Advanced Voice Mode, Real time API, 그리고 Function Calling: 2AICC의 핵심 기술
OpenAI가 공개한 Advanced Voice Mode, Real time API, 그리고 Function Calling. 이 세 기술이 결합하여 2AICC의 핵심을 이룬다. 각 기술의 역할은 명확하다. Advanced Voice Mode는 고객의 음성을 정확히 인식하고 감정을 파악한다. Real time API는 GPT-4o와 실시간으로 연결되어 상황에 맞는 응답을 생성한다. Function Calling은 필요한 정보를 데이터베이스에서 가져오고 실제 작업을 수행한다. 이 세 기술이 어떻게 작동하는지 자세히 살펴보자.
- 음성 인식의 마법: STT-TTS 과정의 혁명
기존의 AI 음성 대화 시스템은 마치 통역사를 거치는 것처럼 작동했다. 음성을 텍스트로 바꾸고(STT, Speech To Text), 이를 처리한 뒤 다시 음성으로 변환하는(TTS, Text To Speech) 과정을 거쳤다. 이 과정에서 무엇이 잘못됐을까?
상상해보자. 당신이 친구에게"와, 정말 대단한 아이디어네."라고 비꼬는 톤으로 말했다고 하자. 그런데 이 말이 텍스트로 변환되면 어떻게 될까? "와, 정말 대단한 아이디어네."라는 글자만 남는다. 당신의 비꼬는 톤은 어디로 갔을까? 그렇다. 사라져버린 것이다.
Advanced Voice Mode는 이 문제를 어떻게 해결했을까? 놀랍게도 이 과정을 완전히 제거해버렸다. 음성을 직접 처리하고, 음성으로 바로 대답한다. Speech To Speech이다. 마치 인간의 뇌가 작동하는 것처럼 말이다. 이로 인해:
- 감정과 의도가 그대로 전달된다. 비꼼, 기쁨, 분노 등 모든 감정이 살아있다.
- 대화가 물 흐르듯 자연스럽다. 중간에 번역 과정이 없으니 당연하다.
- 사투리? 외국인 억양? 문제없다. 모든 말투를 있는 그대로 이해한다.
Advanced Voice Mode의 혁신적 힘은 GPT-4o와의 실시간 연결에서 비롯된다. 최근 발표된 Open AI의 GPT-4o는 추론이 가능한 인공지능이라는 평가를 받고 있다. 즉, '생각하는 AI'라는 것이다.
GPT-4o는 단순히 스크립트 기반 응답을 하는 것이 아니라 생각하고 응답한다는 것이다. 이 모델은 복잡한 고객 문의에 직면했을 때, 마치 숙련된 상담원처럼 단계적으로 사고하고 논리를 전개한다. '체인 오브 소트(Chain of Thought)' 방식을 활용하여 고객의 실제 니즈를 파악하고 최적의 해결책을 제시하는 것이다.
예를 들어, 복잡한 보험 청구 과정에서 GPT-4o는 다음과 같이 작동할 수 있다:
- 고객 상황 분석: 보험 가입 내역, 청구 이력, 현재 상황을 종합적으로 평가
- 약관 해석: 복잡한 보험 약관을 실시간으로 분석하고 해당 사례에 적용
- 예외 사항 고려: 일반적인 규정과 고객 특수 상황을 비교 분석
- 최적의 해결책 도출: 고객에게 가장 유리한 청구 방법 제시
- 설명 및 근거 제공: 각 판단에 대한 논리적 근거를 고객이 이해하기 쉽게 설명
이 과정에서 GPT-4o는 단순히 미리 정해진 답변을 제시하는 것이 아니라, 실시간으로 정보를 분석하고 추론하여 맞춤형 해결책을 도출해낸다.
GPT-4o의 이러한 '생각하는' 능력이 Advanced Voice Mode와 결합되면서, AI와 자연스러운 음성 대화를 할 수 있게 된것이다.
2. Real time API: 기업을 위한 Advanced Voice Mode
OpenAI가 선보인Advanced Voice Mode와 GPT-4o의 결합은 그 자체로 혁명적이다. 하지만 이 혁신적인 기술은 OpenAI의 전유물이었다. 일반 기업들은 이런 첨단 AI 기술을 활용하는 것을 꿈꿀 수만 있었을 뿐, 실제로 구현하기는 불가능했다. 그런데 Real time API의 등장으로 이 모든 것이 바뀌었다.
Real time API는OpenAI의 최첨단 AI 기술을 일반 기업들이 손쉽게 활용할 수 있게 해주는 개발툴이다. 이것은 마치 AI 기술의 민주화와도 같은 사건이다. 그렇다면 이 API의 핵심은 무엇일까요?
Real time API의 비밀 병기는 바로 웹소켓 프로토콜을 이용한 GPT-4o와의 실시간 양방향 통신이다. 기존의 HTTP 요청-응답 모델과는 달리, 이 프로토콜은 클라이언트와 서버 간 지속적인 연결을 유지한다. 이게 무슨 의미일까요? 마치 AI와 직통 전화선을 연결한 것처럼, 실시간으로 대화할 수 있게 되었다는 뜻이다.
이 API의 주요 기술적 특징들을 살펴보자:
- 초저지연 통신: 웹소켓의 전이중(full-duplex) 통신을 활용해 음성 입력과 출력 간의 지연을 100ms 이하로 유지한다. 이는 실제 대화와 거의 구분이 안 될 정도의 즉각적인 반응을 의미이다.
- 실시간 스트리밍 처리: 음성 입력을 실시간으로 GPT-4o에 전송하고 처리한다. 대규모 음성 파일을 업로드하는 시간을 절약하여, 복잡한 문의에도 신속하게 대응할 수 있게 된다.
- 상태 유지(Stateful) 연결: 대화의 맥락을 지속적으로 유지한다. AI가 이전 대화 내용을 기억하고 참조할 수 있어, 더욱 자연스럽고 일관된 대화가 가능해진다.
- 확장성: 동시에 수천 개의 연결을 처리할 수 있다. 대규모 고객 서비스 운영에도 문제없이 대응할 수 있다는 뜻이다.
- 철저한 보안: TLS/SSL 암호화를 통해 고객 데이터를 안전하게 전송된다. 개인정보 보호에 대한 우려를 해소하고, 규제 준수를 보장한다.
- 다양한 플랫폼 지원: 웹, 모바일, 데스크톱 등 어떤 플랫폼에서도 구현이 가능하다. 고객이 선호하는 어떤 채널에서도 일관된 고품질의 서비스를 제공할 수 있게 된다.
3. Function Calling: AI의 실행력 강화
Function Calling은 사용자의 요청을 이해하고, 외부 데이터베이스에 접근해서 필요한 데이터를 가지고와 서 필요한 작업을 수행할 수 있다.
예를 들어, 고객이 "내 계좌 잔액을 알려줘"라고 요청하면, AI는 이를 이해하고 '계좌잔액조회' 함수를 호출하여 실제 데이터를 가져올 수 있다. 더 나아가 "지난 3개월간의 지출 내역을 그래프로 보여줘"와 같은 복잡한 요청에도 대응할 수 있다. AI는 이를 위해 데이터 조회, 분석, 그리고 시각화 함수를 순차적으로 호출하여 고객에게 원하는 정보를 제공할 수 있다.
Function Calling의 주요 특징은 다음과 같다:
- 실시간 데이터 접근: AI는 실시간으로 필요한 데이터에 접근하여 최신 정보를 제공할 수 있다.
- 복잡한 작업 수행: 여러 단계의 프로세스가 필요한 복잡한 요청도 AI가 자동으로 처리할 수 있다.
- 시각화 및 분석: 데이터를 그래프나 차트로 시각화하여 고객이 이해하기 쉽게 정보를 전달할 수 있다.
- 맞춤형 서비스: 고객의 요구에 따라 다양한 기능을 조합하여 맞춤형 서비스를 제공할 수 있다.
이러한 Function Calling 기능은 Advanced Voice Mode와 Real time API와 결합하여 2AICC의 능력을 한층 더 강화한다. 고객은 자연스러운 대화를 통해 복잡한 요청을 할 수 있고, AI는 이를 정확히 이해하고 실행하여 즉각적인 결과를 제공할 수 있게 된다.
3. 고객센터의 미래: AI와의 새로운 대화
이 세 기술이 실제로 어떻게 작동하는지, 온라인 쇼핑몰의 고객 서비스 상황 예시를 통해 살펴보자.
상황: 고객이 온라인 쇼핑몰에서 구매한 티셔츠의 사이즈가 작아 교환을 원한다.
고객: (실망한 어조로) "안녕하세요, 지난주에 주문한 빨간색 티셔츠가 너무 작아요. L 사이즈로 교환할 수 있을까요?"
Advanced Voice Mode: (고객의 음성에서 실망감을 감지)
Real-time API (GPT-4o): (감지된 감정을 바탕으로 GPT-4o가 적절한 응답을 생성)
AI: (공감하는 톤으로) "네, 고객님. 불편을 끼쳐 정말 죄송합니다. L 사이즈로 교환 가능한지 바로 확인해 드리겠습니다."
Function Calling:(상품 데이터베이스에서 티셔츠 데이터를 호출)
AI: "죄송합니다만, 현재 빨간색 티셔츠의 L 사이즈 재고가 없네요. 대신 다른 색상의 L 사이즈를 확인해 볼까요?"
고객: "네, 어떤 색상이 있는지 알려주세요."
AI: "알겠습니다. 같은 디자인의 티셔츠로 L 사이즈가 가능한 다른 색상을 찾아보겠습니다."
AI: "확인해 보니 L 사이즈로 파란색, 초록색, 회색이 재고가 있습니다. 이 중에서 선호하시는 색상이 있으신가요?"
Function calling : (파란색, 초록색, 회색 티셔츠를 화면에 표시)
고객: (관심 있는 어조로) "음, 파란색이 괜찮을 것 같아요. 파란색은 어떤 느낌인가요?"
Advanced Voice Mode: (고객의 어조에서 관심을 감지)
AI: "네, 파란색에 관심이 있으시군요. 파란색에 대해 좀 더 자세히 알아보겠습니다."
AI: "파란색 티셔츠는 네이비에 가까운 진한 파란색입니다. 면 100% 소재로, 빨간색 티셔츠와 동일한 디자인입니다. 가슴 왼쪽에 작은 로고가 있고, 목둘레는 둥근 라운드넥 스타일입니다. 여름철 데일리 룩으로 인기가 많은 제품이에요."
Function calling : (파란색 티셔츠의 상세 정보를 화면에 표시)
고객: "네, 들어보니 괜찮네요. 그럼 파란색으로 교환해 주세요."
AI: "네, 알겠습니다. 파란색 L 사이즈로 교환 신청을 진행하겠습니다."
AI: "교환 신청이 완료되었습니다. 새 상품은 1-2일 내에 발송될 예정이며, 기존 상품은 배송 기사님이 방문 시 회수할 예정입니다. 교환 과정에 대해 더 궁금하신 점이 있으신가요?"
고객: "아니요, 잘 알겠습니다. 감사합니다."
AI: "네, 도움이 되어 다행입니다. 새로 받으실 파란색 티셔츠가 잘 맞기를 바랍니다. 추가 문의사항이 있으시면 언제든 연락 주세요. 좋은 하루 되세요!"
이 시나리오에서 볼 수 있듯이, Advanced Voice Mode는 고객의 감정 변화를 실시간으로 감지하여 상황에 맞는 대응을 가능케 한다. Real-time API를 통한 GPT-4o는 이 감정 정보와 대화 맥락을 바탕으로 적절한 응답을 생성한다. Function Calling은 상품 데이터베이스에 실시간으로 접근하여 재고 확인, 색상 옵션 조회, 교환 처리 등 실제 업무를 수행한다.
이처럼 OpenAI의Advanced Voice Mode와 Real time API, fuction calling은 고객센터의 미래를 완전히 새롭게 그려낼 수 있다. 이 기술들이 가져올 변화는 고객 서비스의 패러다임을 근본적으로 바꿀 것으로 보인다.
기업들은 Real time API를 통해 자사만의 Advanced Voice Mode를 구축하게 될 것이다. 이는 기업의 특성과 고객의 요구에 맞춤화된 AI 상담 시스템을 의미한다. Functional calling을 통해 자사의 전문 데이터베이스에 실시간으로 접근하고, GPT-4o를 통해 복잡한 질문에도 정확하고 맥락에 맞는 답변을 제공할 수 있게 된다.
더 나아가, 기업들은 자사의 브랜드 아이덴티티에 맞는 음성과 대화 스타일을 AI에 적용할 수 있게 된다. 이는 브랜드 경험의 일관성과 고객 만족도 향상으로 이어질 것이다.
2AICC의 도입으로 인해 고객센터는 완전무인인공지능 서비스센터로 변모할 것으로 예상된다. 2AICC 시대의 도래는 피할 수 없는 흐름이다. 이제 우리는 고객센터 상담원과 작별을 고해야 할 때가 온 것 같다. AI가 주도하는 완전히 새로운 모습의 고객센터가 우리 앞에 다가오고 있다. 인간 상담원의 목소리를 그리워할 날이 올지도 모르지만, 더 빠르고 정확한 서비스로 우리를 맞이할 AI 상담원의 시대가 시작되고 있다.