미디어 이슈 & 트렌드 60호(1+2월)

본문

2024년 미디어 환경변화와 생존전략

생성 AI가 만들어가는 빅 트렌드:
생성 콘텐츠, SW 생산성, 그리고 AI 컴패니언

유재흥(소프트웨어정책연구소 책임연구원)

사이트의 위치:

요약글

2023년 글로벌 화두로 등장한 생성 AI는 2024년에도 그 영향력을 이어갈 것으로 예상된다. 특히 생성 AI로 인해 가장 큰 영향을 받을 미디어, 콘텐츠 산업에서 실제적인 활용이 본격화될 것이다. 2024년 생성 AI가 산업에 미치는 영향을 크게 세 가지 점에서 주목할 필요가 있다. 첫째, 생성 AI 기술로 인한 콘텐츠 산업 자체의 성장이다. 둘째, 기존 소프트웨어와 접목되어 생산성을 향상시키는 도구로서 생성 AI의 활약이다. 셋째, 인공지능이 하드웨어와 본격적으로 융합되면서 반려 AI 형태로 우리의 일상에 자리 잡는 모습이다. 이 글에서는 생성 AI의 최신 동향을 간략히 살펴보고 향후 생성 AI가 만들어 가는 트렌드를 사례를 통해 구체적으로 살펴본다.

1. 들어가며

2023년은 생성 AI의 한 해였다. 2022년 11월 오픈AI의 챗GPT는 인공지능의 새로운 시대를 알렸다. 마이크로소프트, 구글, 메타, 아마존 등 글로벌 빅테크 기업들은 빠르게 경쟁에 뛰어들어 더 크고 성능 좋은 초거대 인공지능 언어 모델(LLM) 개발에 박차를 가하며 하루가 멀다 하고 관련 소식을 쏟아 냈다. 인공지능 기술에 회의적이던 일론 머스크 역시 xAI라는 인공지능 기업을 세우고 경쟁에 참여하였으며 초반에 별다른 반응을 보이지 않던 애플도 작년 여름 애플 GPT 개발에 착수했다는 소식을 전했다. 우리나라에서는 네이버가 작년 8월 챗GPT 대항마로 한국형 초거대 언어 모델 하이퍼클로바X를 상용화했으며, LG AI연구원은 B2B에 특화된 초거대 인공지능 모델 엑사원2를 공개했다. 업스테이지, 코난테크놀로지, 뤼튼 같은 중소기업들도 빅테크 기업들의 기반 모델(Foundation Model)을 활용하거나 오픈소스 기반 자체 언어 모델을 개발해 소개했다. 통신사 역시 초거대 언어 모델 경쟁에 뛰어들어 SKT는 에이닷(A.)을, KT는 믿음(Mi:dm)을, LG유플러스는 익시젠이라는 생성 AI를 개발해 고객 응대 서비스 등에 활용할 계획이다.

문장 생성, 요약, 번역, 질의 응답 등 언어 작업에 특화된 언어 모델과 함께 이미지 생성에 특화된 모델들도 나날이 발전하고 있다. 해외에서는 스태빌리티AI의 스테이블 디퓨전(Stable Diffusion), 미드저니(Midjourney), 오픈AI의 달리(Dall-E) 등이 공개되어 사용자들의 관심을 끌고 있으며 국내에서는 이미지 생성 모델에 집중하고 있는 카카오브레인이 2022년 12월 칼로1.0을 공개한 후 작년 7월 업그레이드 모델인 칼로2.0을 선보였다. 그 외 오노마AI(웹툰 제작 지원), 리빌더AI(3D 이미지 생성 기술), 라이언로켓(가상인간 이미지 생성 기술 라이브 스왑), 씨앤에이아이(이미지 생성 AI 플랫폼, Tivv) 등의 스타트업들이 등장하고 있다.

맥킨지는 생성 AI 기술이 연간 최대 4조 4,000억 달러 이상 가치를 생산할 것으로 전망하고 있으며 전 산업에 영향을 미칠 것으로 예측하고 있다. 전문가들은 생성 AI가 가장 크게 영향을 미칠 분야로 콘텐츠 미디어 시장을 주목한다. 텍스트, 이미지, 오디오의 생성 자체가 이미 새로운 콘텐츠의 생산이며, 다양한 분야에서 생성 AI 기술이 사람들의 업무를 대신하고 자동화할 것이라고 예측한다. 생성 AI 분야에서 초기 유니콘 기업으로 등극한 미국 재스퍼(Jasper)의 주요 서비스는 광고 문구 제작 지원이다. 제작된 글은 블로그 기사, 소셜 미디어 게시물로 활용되고 주목을 끄는 문구로 광고 효과를 높이는 데 기여한다고 홍보한다.

이번 2024년 CES의 슬로건은 'All Together, All On'으로 하드웨어와 인공지능의 본격적인 융합을 선포하고 있다. 고도로 지능화되고 있는 인공지능과 결합한 하드웨어의 진화를 보여주는 행사였다. 생성 AI 기술의 발전은 작년 12월 구글이 현존 최고 성능을 자랑한다고 발표한 초거대 인공지능 모델 '제미나이'까지 이르고 있다. 구글은 제미나이 울트라 모델의 최대 규모 매개변수를 기반으로 각종 벤치마크에서 최고 수준 성능을 나타낸 것으로 보고하고 있다. 특히 구글은 제미나이를 네이티브 멀티모달(Native Multimodal) AI 모델로 소개하며, 텍스트뿐만 아니라 이미지, 오디오 등 복합적인 데이터를 학습하고 출력하는 특징이 앞으로 뉴노멀이 될 것이라 선언했다. 제미나이 나노(nano) 모델은 인터넷 연결 없이 오프라인 모드에서 스마트폰에 설치되어 작동한다. 올해는 멀티모달 AI 모델 경쟁이 예상되고, 오픈AI가 1월 초에 선보인 GPT 스토어가 AI 기반 모델을 활용한 서비스 생태계의 본격적인 개화를 알렸다. 바야흐로 AI를 활용한 새로운 미디어 생태계가 열리고 있다. 본 고에서는 올해 생성 AI를 통한 미디어 산업의 주요 트렌드를 세 가지 측면에서 살펴본다. 첫째 생성 AI 기술이 콘텐츠 산업을 더욱 풍부하게 만들 것이다. 둘째 기존의 소프트웨어에 생성 AI 기술이 결합되어 생산성을 극대화한다. 마지막으로, 생성 AI 기술, 콘텐츠, 그리고 하드웨어의 융합이 점차 가속되고 일상화되는 트렌드에 주목한다.

2. 생성 AI가 만드는 빅 트렌드

2-1. 생성 AI로 풍성해지는 콘텐츠 시장

글로벌 시장조사 업체인 IDC에 따르면 2027년 세계 생성 AI 시장 규모는 1,511억 달러(약 196조 원)에 달하며 2023년 전 세계 생성 AI 솔루션 시장은 약 160억 달러 규모다.1) 생성 AI 솔루션 시장의 2023년~2027년 5년간 연평균 성장률은 73.3%로 2027년 해당 시장은 1,430억 달러 규모에 이를 것으로 예상되고 있다. 급성장하는 생성 AI는 보험, 법률, 기업 생산성 등 광범위한 산업 분야에 적용될 것으로 예측되며 가장 큰 비중을 차지하는 분야는 소비자 부문으로 검색 엔진, 글쓰기 도우미, 이미지 생성 등이 포함되고 이어 미디어 및 엔터테인먼트 부문에서 활용이 두드러지게 증가할 것으로 예측된다.2)

영국의 한 생성 AI 분석가는 2025년 인터넷에 유통되는 콘텐츠의 90%가 AI로 만들어질 것으로 예측할 만큼 향후 생성 AI로 생산된 정보는 폭발적으로 증가할 전망이다. 생성 AI는 일반 사용자부터 전문가에 이르기까지 다양한 계층이 이용할 것으로 예상되는데 이는 글로벌 빅테크 기업을 비롯한, 다양한 기업이 생성 AI 기반 콘텐츠 제작 솔루션을 앞다투어 출시하여 기술 접근성이 높아지고 있기 때문이다.

오픈AI의 챗GPT, 구글의 바드(Bard), 네이버의 클로바X(ClovaX)와 같은 언어 모델들은 다양한 텍스트를 생성할 수 있고, 스테이블디퓨전, 미드저니, 달리 등 잘 알려진 이미지 생성 AI는 단순한 텍스트 입력만으로도 전문적인 이미지를 만들어 준다. 네이버는 이미 웹툰 제작에 생성 AI를 접목하기 시작했다. 사진 이미지를 웹툰풍 이미지로 바꿔주거나 스케치 그림에 자연스러운 채색을 도와주어 웹툰 제작의 생산성을 높여준다.3)

음원 시장은 생성 AI의 새로운 격전지로 부상하고 있다. 한 시장조사 업체에 따르면 세계 음악 생성 AI 시장 규모는 2032년 약 27억 달러로 성장할 전망이다.4) 작곡, 작사, 보컬, 샘플 생성, 믹싱, 마스터링, 가상 악기 등 음악 업계에서 활용 분야가 매우 다양하기 때문이다. 실제로 구글의 뮤직LM, 메타의 '오디오 크래프트'는 간단한 절차를 거쳐 음악을 만들어 준다.

비디오 영상 서비스 분야도 예외는 아니다. 런웨이의 Gen-2, 피카랩스(Pika Labs)의 Pika1.0과 같은 생성 AI는 프롬프트 입력으로 영상까지 제작해 주는 기능을 선보이고 있다. 영상을 생성하는 AI는 나이 든 배우의 얼굴을 스크린 상에서 젊은 얼굴로 바꿔주는 디에이징 기술, 특정 언어에 맞춰 입 모양을 바꾸는 립싱크 기술 등에도 활용되고 있다. 메타는 텍스트를 비디오로 만드는 '에뮤 비디오(Emu Video)'와 자연어로 이미지를 편집해주는 '에뮤 에디트(Emu Edit)'를 공개했으며 새로운 기능을 챗봇 '메타 AI'와 자사 소셜 미디어 서비스인 인스타그램과 페이스북에 탑재할 예정이다. 유튜브는 짧은 동영상을 일컫는 쇼츠(Shorts) 제작에 생성 AI 기술을 활용한다. 현재 쇼츠는 매월 20억 명 이상의 로그인 사용자에게 700억 건 이상의 일일 조회 수를 기록하고 있는 핵심 콘텐츠로 자리매김하고 있다. 유튜브는 쇼츠를 더 간편하게 만들 수 있는 '드림 스크린' 툴을 작년 9월 출시했다.5) 생성 AI의 영향력이 검색 엔진, 출판, 소프트웨어, 소셜 미디어, 음악, 영화, 게임 등 콘텐츠 전 산업에 광범위하게 확산되고 있다.

그림1 유튜브의 드림 스크린 시연 화면(프롬프트를 입력하면 짧은 영상을 만들어 준다)
유튜브의 드림 스크린 시연 화면(1) 유튜브의 드림 스크린 시연 화면(2)

출처: Youtube 블로그

  • 1) 한국IDC(2023.10.30.), 한국IDC, 2023년 전 세계 생성형 AI 솔루션 지출 약 160억 달러 규모 기록 전망
  • 2) 인공지능타임즈(2023.11.8.), 생성 AI 글로벌 시장, 5년 뒤 77조로 확대...10배 성장
  • 3) 전자신문(2023.9.19.), 생성형 AI 어디까지 왔나?
  • 4) 전자신문(2023.8.7.), 음원 시장 '생성형 AI' 10년 뒤 11배 볼륨 키운다
  • 5) 유튜브 블로그(2023.9.21.), Made On YouTube: Empowering anyone to Create on YouTube

2-2. 생산성을 배가시키는 소프트웨어와의 접목

생성 AI는 기존의 소프트웨어에 접목되어 새로운 부가 가치를 창출하고 생산성을 끌어올리고 있다. 2023년 11월 마이크로소프트는 생성 AI 기능을 탑재한 오피스 프로그램 M365 코파일럿 기업용 버전을 정식 출시하였다. 코파일럿은 기존 워드나 엑셀, 파워포인트, 팀스 등 업무용 애플리케이션에 오픈AI의 생성 AI 기술을 더한 생산성 도구다. AI가 이메일 초안을 작성해주고, 화상회의 내용을 요약해주는 등 생산성을 향상하는 기능이다. 월 30달러 유료 구독 서비스로 이용할 수 있다. 미국의 한 투자은행은 코파일럿으로 2026년까지 연간 총 100억 달러 이상 수익을 올릴 것으로 전망하고 있다.6) 구글도 생성 AI 접목 생산성 소프트웨어 '듀엣(DUET AI)'을 준비하고 있다. 대표적인 미디어 제작 소프트웨어 기업 어도비(Adobe)도 빠르게 생성 AI 기술을 자사 소프트웨어에 접목했다. 작년 9월에 '파이어플라이(Firefly)'라는 생성 AI 기능을 도입하고 프롬프트를 입력하면 이미지와 텍스트 아트를 만들 수 있도록 하였다. 이미지 편집 프로그램인 포토샵, 일러스트레이터, 온라인 디자인 플랫폼 익스프레스에서도 파이어플라이를 통해 생성 채우기, 생성 다시 칠하기 기능 등 이미지 생성 기능을 이용할 수 있다. 어도비는 작년 9월 생성 AI 기능이 추가된 기존 구독 제품 가격이 월 2~5달러 인상될 것을 예고했다. 게임 제작에도 생성 AI 기술이 도입되고 있다. 엔씨소프트는 2023년 8월 게임 업계 최초로 초거대 언어 모델 바르코(VARCO)를 공개했다. 또한, 바르코 스튜디오로 명명한 플랫폼은 생성 언어 모델을 기반으로 게임 제작을 지원한다. 스튜디오는 이미지 생성툴(VARCO Art), 텍스트 생성 및 관리툴(VARCO Text), 디지털 휴먼 생성 및 편집, 운영툴(VARCO Human) 등 게임 콘텐츠 창작 특화 도구를 제공하고 있다.

2-3. AI 컴패니언 중심의 하드웨어 융합

인공지능과 하드웨어 융합의 가속화도 주목해야 할 트렌드다. 글로벌 서비스 로봇 시장은 2030년까지 1,873억 달러(약 246조 원) 규모로 성장할 전망이며 그중 반려 로봇 시장 규모는 2023년 기준 114억 달러(약 15조 원)에서 연평균 25.7% 성장해 2030년 567억 달러(약 75조 원)에 달할 것으로 전망된다.7) 이번 CES 2024에서도 AI 컴패니언으로 명명한 반려 로봇들이 소개되어 주목을 받았다. 미국 라스베이거스에 있는 세계 최대의 구형 공연장 스피어에서 사람의 표정을 읽고 대화하는 인공지능(AI) 휴머노이드 '아우라(Aura)'가 전시되어 관람객을 맞았다. 삼성전자, LG전자, Ogmen 로보틱스 등도 반려 로봇을 선보였다. 삼성전자의 볼리(Ballie)는 2020년 CES에서 소개된 뒤 4년 만에 재등장했다.8) 4년간 연구 개발을 통해 업그레이드한 버전으로 공 모양 로봇이 집 안 곳곳을 돌아다니며 모니터링 하거나, 반려 동물의 상태를 확인하고, 사람과 채팅으로 대화한다. 삼성전자는 볼리를 개인 맞춤형 서비스를 제공하는 제품으로 발전시켜 출시할 예정이다. LG전자 역시 '스마트 홈 AI 에이전트'라는 만능 가사 생활 도우미 AI 로봇을 선보였다. 바퀴가 달린 로봇은 자율 주행 기술을 통해 집 안을 자유롭게 돌아다니고, 멀티모달(Multimodal) 센싱과 첨단 인공지능 프로세스를 토대로 사용자의 상황과 상태를 인지하고 능동적으로 소통하는 기능을 수행한다.9)

미국의 로봇 개발 기업 Ogmen 로보틱스도 반려 동물 돌봄에 특화된 AI 로봇을 선보였다. '오로(Oro)'라는 반려견 컴패니언은 양방향 오디오 및 비디오 기능을 통해 사람이 집을 비운 동안에도 반려견을 계속 주시하고 소통할 수 있을 뿐만 아니라, 함께 놀아주고 간식을 먹여주며 반려견의 불안한 징후를 알아차릴 수 있도록 학습하는 기능을 가지고 있으며 799달러에 출시할 계획이다.10)

그림2 삼성전자, 볼리(Ballie)
삼성전자, 볼리(Ballie) 이미지

출처: 삼성전자

그림3 LG전자, 스마트홈 AI 에이전트
LG전자, 스마트홈 AI 에이전트 이미지

출처: LG전자

그림4 Ogmen 로보틱스, Oro
Ogmen 로보틱스, Oro 이미지

출처: Ogmen 로보틱스

반려 로봇뿐만 아니라 인간의 노동력을 대체할 수 있는 휴머노이드 개발도 속도를 내고 있다. 지난 2021년 자동차 공장 부품 운반 등의 목적으로 개발한 것으로 알려진 테슬라의 옵티머스는 2023년 12월 2세대로 발전했다. 무게를 줄이고 보행 속도를 높이며 자연스러운 움직임에 초점을 맞췄던 기술은 이제 학습을 통해 지능을 가지고 작업을 수행하는 지능형 로봇으로 업그레이드되었다. 지난 1월 16일 일론 머스크는 옵티머스가 빨래를 스스로 접는 모습을 X( 트위터)를 통해 공개했다.11) 현재는 아주 비싼 마리오네트 수준으로 평가받기도 하지만 경제성을 달성한다면 공장이나 가정 내 노동력을 대체할 수 있을 것으로 예상된다.

오픈AI의 CEO 샘 알트먼이 투자해 유명한 로보틱스 스타트업 1X는 2023년 바퀴 달린 휴머노이드 이브(EVE)를 공개한 데 이어 2024년 1월 12일 집안일을 자율적으로 수행하는 휴머노이드 로봇 NEO를 공개했다. 로봇과 인공지능 모델이 결합해 작업을 스스로 수행하고, 또 스스로 학습하면서 인간을 노동으로부터 자유롭게 할 수 있을지 기대를 모으고 있다.

그림5 테슬라의 빨래 접는 로봇 옵티머스
테슬라의 빨래 접는 로봇 옵티머스일론머스트  이미지

출처: 일론머스크 트위터

그림6 1X의 EVE와 NEO
1X의 EVE와 NEO 이미지

출처: 1X

3. 전망

지난 1월 12일 마이크로소프트는 애플을 누르고 시총 최고 기업 지위를 회복했다. 마이크로소프트의 시총은 이날 2조 8,900억 달러(약 3,800조 원)로 애플의 2조 8,700억 달러를 앞질렀다. 한때 아마존, 애플에 밀리며 IT 왕좌에서 밀리는 듯한 모습을 보이던 마이크로소프트가 2019년부터 투자한 오픈AI의 급성장과 한 박자 빠른 생성 AI 전략에 힘입어 다시 왕좌의 지위를 차지한 것이다. 전문가들은 산업의 모든 규칙을 바꿔놓는 '게임 체인저'로서 생성 AI의 주도권을 MS가 잡은 덕분이라고 평가하고 있다.

2024년은 인공지능의 본격적인 확산이 기대되는 한 해다. 특히 생성 AI를 활용한 콘텐츠 시장이 급성장할 것으로 예상된다. 기술적으로 언어 모델뿐만 아니라, 이미지·오디오 등 멀티미디어 기반 특화 모델들이 더욱 고도화되어 산출물의 품질이 나날이 좋아질 것이다. 여기에 구글의 제미나이(Gemini)가 표방하는 '네이티브 멀티모달' AI 모델들의 경쟁이 치열해질 것으로 예상된다. 오픈AI뿐만 아니라, 기존의 초거대 언어 모델을 개발하던 국내외 기업들도 멀티모달 AI 기술 역량 확보에 집중할 것이다. 사용자들은 텍스트에 머물러 있지 않고 다양한 이미지와 음성, 영상으로 인공지능과 더욱 활발하게 소통하게 될 것이다.

AI 표현 사진

특히, 2024년에는 우리나라를 비롯해 미국, 러시아, 인도, 대만 등 세계 40여 개국에서 40억 명이 넘는 유권자가 참여하게 될 선거는 생성 AI를 활용한 콘텐츠 제작에 커다란 계기가 될 수 있다. 선거 전략의 대세가 된 소셜 미디어 전쟁에서 생성 AI를 이용한 텍스트, 이미지, 쇼츠 동영상에 이르기까지 다양한 정치, 홍보 콘텐츠가 양산될 것으로 전망된다. 가짜 뉴스, 가짜 정보의 논쟁도 한층 더 치열하게 전개될 것이다.

무엇보다 생성 AI 콘텐츠의 붐업과 함께 인공지능과 하드웨어의 융합이 빠르게 전개될 것이다. 2024년 CES에서 보여주었듯이 모든 곳에 AI가 탑재되고 있으며, 시민의 삶 속에 깊숙이 침투하기 시작했다. 인간의 노동력을 대체하기 위한 휴머노이드 개발은 물론, 감성까지 탑재하며 'AI 컴패니언'으로 지칭하는 반려 로봇은 인간과 AI의 공존을 앞당기게 될 것이다. AI를 눈으로 보고 만지는 시대가 펼쳐지고 있다.

참고문헌

  • 한국IDC(2023.10.30.), 한국IDC, 2023년 전 세계 생성형 AI 솔루션 *지출 약 160억 달러 규모 기록 전망
  • 인공지능타임즈(2023.11.8.), "생성 AI 글로벌 시장, 5년 뒤 77조로 확대...10배 성장"
  • 전자신문(2023.9.19.), 생성형 AI 어디까지 왔나?
  • 전자신문(2023.8.7.), 음원 시장 '생성형 AI' 10년 뒤 11배 볼륨 키운다
  • 유튜브 블로그(2023.9.21.), Made On YouTube: Empowering anyone to Create on YouTube
  • CNBC(2023.11.1.) Microsoft starts selling AI tool for Office, which could generate $10 billion a year by 2026
  • 아주경제(2024.1.16.), 75조 원 시장 잡자…삼성 '볼리'·LG 'AI 에이전트' 반려로봇 대결
  • 서울경제(2024.1.9.), 삼성전자, 맞춤 반려로봇 '볼리' 4년 만에 깜짝 공개
  • LG전자 뉴스룸(2023.12.27.)., LG전자, '스마트홈 AI 에이전트' 첫 공개
  • https://orobuddy.com/
  • TechCrunch (2024.1.16.), Elon's Tesla robot is sort of 'ok' at folding laundry in pre-scripted demo