미디어 이슈 & 트렌드56호(5+6월)

본문

AI와 미디어의 결합

Cognitive AI를 활용하여 더 똑똑해진
3D 아바타 챗봇 서비스

오성식(삼성SDS 기술그룹(AI Automation개발) 그룹장)

사이트의 위치:

요약글

Cognitive AI Service는 사람의 인지 능력을 모방하려는 인공지능 기술이다. 이 기술은 인간처럼 문제를 해결하고 판단하는 능력을 갖춘 컴퓨터 프로그램을 개발하는 데 사용되며, 이를 통해 기업이나 개인은 효율성을 높이고 생산성을 향상시킬 수 있다.
Cognitive AI 기술을 활용하여 사용자의 감정을 분석하여 리액션하고, 사용자의 언어를 감지하고, 문서 및 텍스트로부터 핵심 키워드를 추출하는 등 사용자에게 인지된 유용성(Perceived Usefulness)과 인지된 용이성(Perceived ease of Use), 더 나아가 인지된 유희성(Perceived Playfulness)에 이르기까지 다양한 사용자 경험을 제공할 수 있다.

특히 이미지 처리 AI 기술의 발전은 눈부신 속도로 진행되고 있으며, Pre-built 문서 정보 추출(Intelligent Document Processing) 모델 및 OCR(Optical Character Recognition) 기술을 통해 비정형 문서 및 문서 이미지 처리와 관련된 업무에 손쉽게 접근하고 자동화까지 가능해져 워크플로우에서 활용이 가능하다.

향후 챗GPT(ChatGPT)를 활용하여 공개된 범용 지식에 대한 챗봇 답변으로 활용이 가능하며, 데이터 전처리와 같이 많은 노력과 시간이 들어가는 데이터 정비 작업에도 많은 도움을 줄 것이다. 또한 증강현실, NFT와 같은 메타버스(Metaverse) 기술과 연계하여 기존에는 상상하지 못했던 온·오프라인의 경계를 허물어 공급자와 사용자의 니즈를 뛰어넘는 다양한 서비스를 제공하게 될 것으로 기대된다.

전문 지식을 학습하고 사용자의 발화에서 의도를 분석하여 미리 정비된 답을 내놓는 챗봇에서 불특정 질문에도 답할 수 있는 언어 모델인 챗GPT까지 대화형 AI의 혁신은 계속되고 있다. 2022년 12월에 한국 인터넷협회 주관 웹어워드 코리아에서 최고대상을 받은 삼성SDS 챗봇/웹챗(3D 아바타)가 Cognitive AI와 챗GPT를 연계하고 있는 모습을 살펴보며 또 다른 혁신을 상상해보자.

그림1 삼성SDS 챗봇/웹챗(3D 아바타)
삼성SDS 챗봇/웹챗(3D 아바타) 이미지

1. Cognitive AI란

Cognitive AI Service는 인공지능 분야 중 하나로, 사람의 인지 능력을 모방하려는 기술이다. 이 기술은 인간처럼 문제를 해결하고 판단하는 능력을 갖춘 컴퓨터 프로그램을 개발하는 데 사용되며, 이를 통해 기업이나 개인은 효율성을 높이고 생산성을 향상시킬 수 있다. 예를 들어 음성 인식 기술을 이용한 가상 비서, 자연어 처리를 이용한 챗봇 등이 Cognitive AI Service의 한 부분이다.

그림2 삼성SDS Brity Cognitive Service 아키텍처
삼성SDS Brity Cognitive Service 아키텍처 이미지
그림3 삼성SDS Brity Cognitive Service API
삼성SDS Brity Cognitive Service API 이미지

삼성SDS Brity Cognitive Service는 비정형 데이터 내 정보를 기반으로 의사결정할 수 있도록 텍스트, 이미지, 음성 데이터를 이해하는 인지 능력을 제공하는 서비스로 별도의 머신러닝 전문 지식이 없어도 즉시 사용 가능한 분류, 추출, 추천, 요약 등 17종의 API를 제공한다. 고객 상담 업무 환경에서는 고객 문의 사항의 감정을 분류하고 키워드를 감지하여 상황을 판단하며 상담사의 상담 내용을 분석하여 상담 품질을 평가하여 고품질의 상담이 이루어질 수 있도록 지원한다. 이메일 문의 내용의 경우 사람이 일일이 분류, 대응하지 않고 이메일의 의도, 감정을 기반으로 분류하고 RPA와 결합하여 단순 업무에 대한 자동 응대 및 분류된 메일의 후속 처리를 자동화한다. 이렇듯 사용자가 업무를 자동화할 때, 단계별로 AI 기술을 적용해 자동화 생산성을 더욱 향상시킬 수 있다.

2. Cognitive AI를 활용한 삼성SDS 3D 아바타 챗봇 서비스

2-1. 감정 분석 AI를 활용한 아바타 피드백

그림4 삼성SDS Brity Cognitive Service 감정 분석
삼성SDS Brity Cognitive Service 감정 분석 이미지

감정 분석에 아바타를 활용하는 것은 사용자와의 상호작용을 더욱 생동감 있게 만들어 줄 수 있다. 일반적인 감정 분석 서비스는 사용자가 발화한 텍스트나 음성을 기반으로 감정을 예측하여 사용자에게 긍정, 부정, 중립의 의견 결과를 텍스트 형태로 전달하지만 아바타를 활용하면 분석 결과를 시각적으로 표현함으로써 더욱 직관적이고 생동감 있는 정보를 제공할 수 있다. 또한 아바타에 다양한 표정과 동작을 부여함으로써 사용자와의 감정적인 교류를 통해 몰입감을 높일 수 있는 장점이 있다.

그림5 삼성SDS 3D 아바타 챗봇 리액션
삼성SDS 3D 아바타 챗봇 리액션 이미지(1)
삼성SDS 3D 아바타 챗봇 리액션 이미지(2)

이러한 장점들을 통해 감정 분석에 아바타를 활용하는 것이 사용자 경험과 상호작용을 개선하는 데 큰 도움을 줄 수 있다.

삼성SDS 3D 아바타는 자사 Cognitive AI 엔진을 사용할 뿐만 아니라 Google, MS Azure, NAVER에서 제공하는 다양한 Cognitive Service와도 연계가 가능하다. 감정 분석 서비스로부터 도출된 사용자의 감정 상태(긍정/부정)를 가지고 Unity 3D 엔진으로 개발된 아바타의 다양한 감정 모션을 적절하게 표출하여, 더 생동감 있는 챗봇 서비스를 제공하고 있다. 그 밖에도 상담사와 대화할 때, 사용자의 의도 패턴 및 성향 등과 같은 정보를 활용하여 긍정적인 데이터 분석 효과를 기대할 수 있다.

2-2. 언어 감지 AI를 활용한 Forum 게시글 Language Tagging

언어 감지 AI 기능은 입력된 텍스트 언어를 자동으로 감지하고 식별하는 AI 기술이다. 이 기술은 텍스트 분석 및 자연어 처리 분야에서 많이 활용되며, 검색 엔진, 온라인 번역, 콘텐츠 관리 시스템 등에서 활용되고 있다. 언어 감지 기술은 텍스트의 언어 특징을 추출한 후, 이를 기반으로 어떤 언어가 작성되었는지를 판별하는데 이를 위해서는 자연어 처리 기술, 통계적 분석, 머신러닝, 딥러닝 등 다양한 기술과 알고리즘이 사용된다. Cognitive AI에서도 이와 같은 기술을 활용하여 언어 감지 기능을 개발하였으며, 이를 활용하여 Brityworks.ai 글로벌 포털에서는 사용자가 게시글을 작성할 때 사용자가 언어를 별도로 입력하지 않더라도 AI가 사용자 게시글의 언어를 판별해서 언어를 Tagging한다. 그리고 Tagging된 언어 정보를 기반으로 사용자는 게시글을 언어별로 Filtering할 수 있고, 콘텐츠 검색 기능을 사용할 때 사용자 언어에 최적화된 콘텐츠를 우선으로 제공하여 사용자에게 편의성을 제공한다.

그림6 포털 게시판 Language Tagging & Filtering
포털 게시판 Language Tagging & Filtering 이미지

2-3. 핵심 키워드 추출 AI를 활용한 Forum 게시글 자동 Hash Tagging

핵심 키워드 추출은 자연어 처리 기술 중 하나로, 문서나 텍스트 데이터에서 중요한 단어를 추출하는 기술이다. 이를 통해 해당 문서의 내용을 요약하거나, 검색 엔진에서 검색어로 활용하는 등 다양한 용도로 활용될 수 있다. Brityworks.ai 포털에서는 이를 활용하여 사용자가 게시글을 작성할 때 실시간으로 사용자의 글을 분석하고 핵심 키워드를 추출하여 해시태그를 쉽게 추가할 수 있도록 기능을 제공하고 있다. 사용자가 해시태그를 편리하게 추가할 수 있게 함으로써 태그 기반으로 검색엔진을 최적화할 수 있을 뿐만 아니라, 태그 랭킹이나 자주 사용하는 태그 등의 기능으로 사용자 맞춤형 마케팅에도 유용하게 활용할 수 있다.

그림7 포털 게시판 해시태그 추천 및 자동 해시태깅
포털 게시판 해시태그 추천 및 자동 해시태깅 이미지

2-4. 이미지 처리 AI 활용 사례

AI 기술의 발전은 다양한 분야에서 혁신적인 변화를 가져오고 있는데 특히 이미지 처리 AI 기술의 발전은 눈부신 속도로 진행되고 있으며, 이러한 발전은 챗봇 분야에도 큰 변화를 가져올 것으로 기대된다. 삼성SDS의 Brity Cognitive에서는 Pre-built 문서 정보 추출(Intelligent Document Processing) 모델 및 OCR(Optical Character Recognition, 문서에 새겨진 문자를 빛을 이용하여 판독하는 광학식 문자 판독 장치) 기술을 제공하고 있다. 이러한 기술을 챗봇에 적용하면 비정형 문서 및 문서 이미지 처리와 관련된 업무에 손쉽게 접근하고 자동화까지 가능해져 워크플로우에서 활용이 가능하다.

거래명세서에서 필드 정보를 추출하여 활용하는 것은 물론, 진료비 영수증 정보 추출, 사업자 등록증 정보 추출, 테이블 분석, 문서 이미지 내 포함된 바코드, 텍스트, 로고 콘텐츠에 대한 존재 여부와 값 검증과 같은 콘텐츠 매칭 등 다양한 분야에서 활용이 가능하다.

그림8 삼성SDS의 OCR 기능을 활용한 단순 반복 업무 자동화 사례
삼성SDS의 OCR 기능을 활용한 단순 반복 업무 자동화 사례션 이미지(1)
삼성SDS의 OCR 기능을 활용한 단순 반복 업무 자동화 사례 이미지(2)

이러한 변화는 챗봇 서비스를 더욱 강력하게 만들어 주고 챗봇 사용자들에게 더욱 전문적인 도움을 제공할 수 있게 된다. 또한, 챗봇을 이용하는 고객들의 사용 경험을 향상시키고 다양한 기능 제공을 통해 고객 만족도를 향상시킬 수 있다.

3. 향후 전망 및 시사점

3-1. 정해진 답변을 제공하는 챗봇에서의 챗GPT 활용 계획

정확한 답변을 제공해야 하는 업무용 챗봇이나 로그인 기반으로 사용자 맞춤형 정보를 전달하는 챗봇은 미리 정해지지 않은 불특정 질문에 대해서는 "제가 잘 모르는 내용이에요"와 같은 답변을 내놓는다. 하지만 어떠한 질문이 들어와도 대답하는(심지어 없는 사실을 지어서라도 대답하는) 챗GPT를 경험해 본 사용자들은 이제 챗봇에게서 모른다는 대답을 듣기를 원하지 않는다. 그렇다고 챗GPT만 사용하게 되면 사실이 아닌 챗GPT가 만들어낸 정보 또한 전달될 가능성이 있기 때문에 업무용 챗봇에서 선택할 수 있는 방안이 아니다.

삼성SDS에서는 챗봇이 적절한 의도를 찾지 못하여 답변으로 연결되지 못하는 상황에서만 사용자의 선택하에 챗GPT에게 물어볼 수 있도록 하였다. 여기에는 몇 가지 사전 작업이 필요하다. 먼저 Moderation API를 통해 폭언, 성희롱, 인종차별 등의 사용자 발화는 사전 차단하고, 개인 정보나 민감 정보는 마스킹 처리하여 챗GPT에게 전달한다. 그리고 챗GPT로부터 답변을 제공받는 양식을 약속한다. 예를 들면 챗GPT가 우선 참조할 사이트를 몇 개 알려주고, 모르면 모른다고 이야기할 것을 약속하고(지어서 말하지 않기), 글자 수를 제한하고, Voice of Tone을 설정하는 등 Prompt 엔지니어링 작업을 한다. 마지막으로 사용자에게 답변이 제공될 때 "챗GPT의 답변은 정확한 사실 검증을 거치지 않았으므로 단순 참고만 해주세요"와 같은 문구를 먼저 내놓는다. 그리고 챗GPT의 답변이 제공된 후에는 챗GPT와 계속해서 이야기할 것인지, 의도 분석형 챗봇으로 돌아갈 것인지 사용자에게 선택할 수 있도록 한다.

3-2. 챗봇 대화 지식 전처리 및 정비에 챗GPT 활용 계획

챗봇을 구축할 때, 가장 중요한 단계 중 하나는 다양한 출처와 제공자로부터 수집된 데이터를 구조화하고 일관된 톤으로 전처리하는 작업이다. 이를 위해 도메인 지식을 보유한 인력의 노력과 전처리를 위한 노력이 많이 필요한데, 이러한 작업은 많은 시간과 비용이 소요된다. 이러한 변환 작업을 챗GPT가 소화하고, Fine-Tuning 및 Prompting 기술을 사용하여 적절한 응답을 생성할 수 있다. 또한, 구조화된 지식을 최종 사용자에게 효과적으로 전달하기 위해서는 정보 구성 단계에서도 챗GPT를 사용할 수 있는데, 이를 통해 구조화된 지식을 일관되고 User-Friendly한 구성으로 표현하고 최적의 응답을 생성할 수 있다. 이러한 대화형 인공지능 기술의 발전은 챗봇 구축을 더 효율적으로 수행할 수 있게 되었으며, 비용과 시간을 절감할 수 있게 되었다.

3-3. 증강현실, NFT 등을 활용한 메타버스 챗봇 서비스로의 확장

아바타 챗봇은 증강현실(Augmented Reality)과 NFT(Non-Fungible Token) 기술을 활용한 메타버스 챗봇으로 진화할 것으로 예상된다. 아바타 챗봇의 증강현실 기술은 사용자가 챗봇과 상호작용하면서 현실 세계에서 다양한 가상 객체를 볼 수 있도록 해준다. 예를 들어, 사용자가 아바타 챗봇과 대화하면서 상품을 검색하면, 아바타가 해당 상품을 3D 모델로 사용하는 모습을 시각적으로 확인할 수 있게 된다. 이를 통해 사용자는 좀 더 직관적이고 현실적인 경험을 할 수 있다. 또한 아바타 챗봇에 NFT를 결합하여 다양한 서비스를 제공할 수 있다. 예를 들어, 사용자가 아바타 챗봇과 상호작용하면서 특정 아이템을 얻거나 구매하면, 그 아이템의 소유권이 NFT로 발행되어 아바타를 통해 사용할 수 있다. 사용자는 REDEEM을 통해 아이템을 현실에서 받을 수도 있고, NFT를 거래하여 수익을 창출할 수도 있다. 즉, 메타버스 챗봇을 통해 사용자는 현실 세계와 가상 세계를 자유롭게 오가며 상호작용할 수 있다. 사용자가 챗봇과 대화하면서 가상 세계에서 쇼핑을 할 수 있고, 그 결과를 현실 세계에서 실제로 받을 수 있다. 이를 통해 사용자는 더 풍부하고 혁신적인 경험을 할 수 있다.

기업, 관공서 등과 같은 공급자의 입장에서 보면 메타버스 챗봇은 일반적인 챗봇과 달리 증강현실과 NFT를 활용하여 사용자의 참여도를 높일 수 있어, 사용자들이 공급자와의 상호작용을 더욱 즐겁게 느끼고, 공급자의 더 많은 정보를 습득할 가능성이 높아진다. 따라서 메타버스 챗봇을 통해 회사의 브랜드 이미지를 증강하고, 다양한 이벤트나 쇼핑몰 서비스 등을 제공할 수 있게 되어, 브랜드 인지도와 매출 증대 효과를 기대할 수 있다. 블록체인 기술과 증강현실 기술의 발달로 기존에는 상상하지 못했던 온·오프라인의 경계를 허물어 공급자와 사용자의 니즈를 뛰어넘는 다양한 서비스를 제공하게 될 메타버스 챗봇을 기대해 본다.