[IT 트렌드 바로읽기] 챗GPT에게 길을 묻다?!

2월 14, 2023

2013년 스파이크 존즈 감독의 영화 ‘her’에는 인공지능 사만다(컴퓨터 이름)라는 OS가 등장한다. 주인공인 시어도어는 사만다를 그저 컴퓨터의 운영체제(OS, Operating System)라고만 생각하며 오에스 원(OS 1)을 컴퓨터에 설치할 때, 여자 목소리를 선택한다. 이로써 이 운영체제의 성별은 여성으로 ‘선택’되었고 이름도 사만다로 결정하게 된다. 영화를 본 관객들은 사만다를 통해 기술이 발전하는 와중에 ‘인간’을 도대체 어떻게 정의 내려야 하는가 등의 다양한 문제를 고민했을 것이다. 또한 국내에서도 휴대폰 앱 중에 ‘심심이’라는 서비스가 있었다. 혼자 누군가를 기다리며 심심할 때 ‘심심이’를 불러내 대화를 해 본 경험이 있었다. 처음에는 신기했지만 점차 정해진 답변만 하는 ‘심심이’에 금방 싫증을 느꼈고, 나 외에도 많은 사용자가 그러했는지 ‘심심이’는 사라졌다.

그 후 업그레이드된 소프트웨어가 인공지능을 기반으로 사람과 자동으로 대화를 나누는 채팅하는 로봇, 챗봇(Chatbot)이 나타났다. 정해진 응답 규칙에 따라 사용자 질문에 응답할 수 있도록 만들어진 것은 ‘심심이’와 큰 차이가 없다고 볼 수 있으나, 챗봇은 시스템상 전자게시판이나 통신망에서 여러 사용자가 다양한 주제를 가지고 실시간 모니터링 화면을 통해 대화를 나눌 수 있었다. 이뿐 아니라 챗봇은 사용자의 성향을 파악하기까지 하는 소프트웨어이므로 ‘심심이’와는 확실한 차별화가 되는 소프트웨어였다.

이 챗봇(Chatbot)이라는 이름은 채팅과 자동으로 사람이 하던 일을 수행하는 기계인 로봇에서 한 글자씩 따와 만든 합성어다. 챗봇은 기본적으로 챗봇 API를 제공하는 서버와 서로 통신을 주고받을 수 있는 ‘요청과 응답(Request-Response)’ 구조를 따른다. 즉 사용자가 메신저 대화창에 특정한 메시지를 입력하면, 메신저 사업자의 챗봇 API 서버는 해당 메시지에 적합한 응답을 해달라고 해당 서버에 자동응답을 요청하는 형식이다. 해당 서버는 사용자가 보낸 메시지 규칙에 따라 서버에 규정된 메시지를 챗봇 API 서버에 다시 응답한다. 이때 설정한 규칙에 따라 사용자에게 단순 텍스트만 전달하는 방식 외에도 영상, 이미지, 웹주소(URL) 등을 결합해서 보내주기도 한다.(<채팅봇, 챗봇>, 네이버 지식백과, 재인용)

초기의 챗봇은 단순한 질문을 분석해 문장으로 대답을 내놓는 수준에 그쳤지만 AI가 기반이 되는 기술이 발달하면서 챗봇은 사람과 대화에서 등장하는 문장을 쪼개서 분석하고 이해하여 필요한 업무를 수행하는 정도로까지 진화하게 되었는데 이는 ‘자연어 이해(NLU)‘라 불리는 기술 덕분이다. 이러한 자연어의 이해 기술과 AI기술의 놀라운 발전덕에 영화 속 상황들이 우리들에게 현실로 나타나고 있다.

최근 미국 스타트업 오픈AI가 개발한 인공지능 대화형 챗봇 ‘챗GPT(Chat GPT)’가 바로 그것이다. 이 인공지능 대화형 챗봇 ‘챗GPT(Chat GPT)’는 출시 40일 만에 하루 사용자 1천만 명을 돌파하며 현재 국내에서도 폭발적인 관심을 얻고 있다.

챗GPT는 인터넷에 올라온 방대한 양의 정보를 학습해 사람이 쓴 것과 같은 글을 만들어낸다. 다만 2021년까지의 정보를 학습했기 때문에 시사나 현재 시점과 같은 ‘현재의 정보’는 알려줄 수 없다고 한다. (<ChatGPT: AI 챗봇 ‘챗GPT’에 커지는 표절 우려>, BBC NEWS 코리아, 재인용)

당초 샘 올트먼과 일론 머스크 테슬라 창업자가 2015년 12월 설립한 기업 오픈AI(Open AI)는 지난 2022년 12월 1일 시험 공개한 챗GPT가 닷새 만에 가입자 100만 명을 돌파하는 기염을 토하고 있다. 이에 마이크로소프트사는 오픈AI사와 파트너십을 맺어 왔으며 추가로 수십억 달러를 투자할 것이라 밝혔다.

닷새 만에 가입자 100만 명 가입의 속도는 젊은 층의 선풍적 호응 속에서 출시 75일 만에 100만 이용자를 돌파한 인스타그램보다 15배나 빠른 속도여서 전세계를 놀라게 하고 있다. 그래서 머스크는 챗GPT 공개 뒤 “이제 구글 검색을 챗GPT가 대체할 것”이라고 말했다. 구글 검색을 챗GPT가 대체한다면 검색 엔진을 기반으로 재벌급 대기업으로 떠오른 국내의 네이버, 카카오에게도 큰 위협이 아닐 수 없다. 이처럼 빠른 속도로 가입자가 증가하는 이유는 챗GPT의 놀라운 성능 때문이다.

예컨대 올해 대입수능시험 수학 2번 문제 ‘함수 f(x) = x3제곱 + 3 x 2제곱 + x – 1에 대하여 f’(1)의 값은?’ 을 챗GPT에게 물어보면 바로 마치 수학 일타강사 선생님이 컴퓨터에 들어앉아 있는 듯, 자세한 풀이 과정부터 정답까지를 대화형으로 가르쳐 준다. (A 결과) 반면, 똑같은 질문을 구글에서 검색하면 ‘기존에 이 문제를 풀어 놓은 여러 웹페이지들’을 답안으로 제시하며, 그 중에서 가장 바람직한 답을 고르는 것은 인간의 몫으로 남겨진다.(B 결과) A 결과와 B 결과를 비교하면 차이는 명백하다. 챗GPT는 바로 “이게 정답이야”라고 가르쳐 주는 반면, 구글 검색은 “이 중에서 당신이 골라”라고 제시하는 격이다.

챗GPT는 계속 배워나가는 인공지능이기 때문에, 똑같은 질문을 반복해 물어본다고 해서 똑같은 대답만을 반복하지 않는다. 10초 전에 내가 한 질문에 이미 챗GPT가 답변한 결과를 기반으로 새로운 답을 제시하기 때문에 인간이 같은 질문을 하더라도 답변은 계속 달라지면서 발전해 나간다. 심지어 챗GPT는 한국어 질문에도 매끄러운 한국어 문장으로 답을 해준다. 다만 영어로 물어보면 더욱 빨리, 더욱 정확한 답을 제시해 주는데 이는 AI가 영어로 학습한 부분이 훨씬 방대하기 때문이다. (<머스크가 만들고도 “무섭다”한 ChatGPT 뭐길래? 닷새만에 100만 가입 … ‘구글 검색 천하’ 끝?>, 문화경제, 재인용)

다만, 일부 학계에서는 챗GPT를 학생들이 표절에 활용할 수 있다며 우려를 표한다. 실제로 챗GPT는 의사면허시험 합격 성적을 받기도 했고 경영학 석사(MBA) 시험도 통과했다고 한다. 이에 프린스턴 대학에 재학 중인 한 학생이 AI가 사용됐는지 식별해내는 ‘GPT제로’ 프로그램을 개발했다는 뉴스도 있다. 이러한 우려에 오픈AI는 자체적으로 사람이 작성한 글과 AI가 작성한 글을 판별해내는 툴을 출시했지만 아직 더 많은 테스트를 거쳐야 한다는 의견이 높다. 그러나 이러한 부정적 문제 외 챗GPT는 마케팅 문구나 웹사이트 문구를 쓰는 데 활용되는 등 긍정적인 방향으로도 많이 사용되고 있으며, 바로 이러한 부분에서 챗GPT가 ‘검색’의 새로운 미래가 될 수 있다는 의견도 있다.

이 ChatGPT를 조금 더 상세히 살펴보면 이름은 GPT(Generative Pre-Training: 생성적 사전학습)를 기반으로 한 채팅 서비스라는 의미를 가지고 있다. GTP란 이름에서 중요한 것은 G(Generative), 즉 ‘생성적’ 부분이다. 구글이나 네이버 검색이 ‘기왕에 만들어져 있는 결과물들’을 골라서 보여주는 검색 기능이라면, 챗GPT는 매번 물어볼 때마다 새로운 결과물을 창조(Generative)해 보여준다는 점이 완전히 다르다. 물어볼 때마다 새로운 창조물을 내놓고, 또 그걸 기반으로 새롭게 학습해 다음 번에는 똑같은 질문에라도 더 발전된 새 창조물을 내놓는다는 개념이다. 이러한 챗GPT는 현재 오픈AI가 개발 중인 GPT 프로젝트의 3.5 버전을 기반으로 만들어졌는데, 1750억 개의 파라미터(매개변수)를 갖고 학습하고 추론하는 능력을 지니고 있다고 한다. GPT 3.5 버전이 1750억 개의 파라미터를 갖고 이처럼 놀라운 결과를 내놓고 있지만, 2024년에 공개 예정인 GPT 4.0 버전은 파라미터 숫자가 무려 100조 개라니 그저 상상을 초월할 뿐이다. (문화경제, 위 링크 재인용)

이러한 ‘챗GPT(Chat GPT)’ 출시에 국내 역시도 폭발적인 관심을 모으고 있는 이때 SK텔레콤, KT 등 국내 기업들도 ‘한국형 챗GPT’를 개발하고 있지만, 사람들이 만족할 만한 수준에 이를 수 있을지는 아직 미지수이다. 또한 한국형 챗GPT 상용화에 걸림돌이 되는 요인들이나 발전 방향 역시 궁금증을 가지게 된다. 어찌되었든 현재 IT업계는 트위터, 유튜브, 인스타그램이 100만 사용자를 확보하는데 각각 2년, 8개월, 2개월이 걸렸는데 챗GPT는 단 5일 만에 이를 달성했다는 것과 40일 만에 평균 일간활성이용자(DAU) 1천만 명을 넘겼다는 결과에 상당히 당황하는 분위기이다. 특히 최근 윤석열 대통령이 챗GPT를 직접 사용한 후기를 밝히며 “몇 자 고치면 그냥 대통령 신년사로 나가도 될 정도”라고 극찬하며 국무위원들에게도 꼭 사용해 보라고 적극 권했다는 후문이다.

앞서 말한 국내 기업들의 한국형 챗GPT 개발 참여 상황을 살펴보면 KT는 올해 상반기 안에 한국형 챗GPT인 초거대 인공지능(AI) ‘믿음’을 상용화하겠다고 밝혔고 LG유플러스는 LG AI연구원이 보유한 초거대 인공지능 ‘엑사원(EXAONE)’과 연계한 챗봇 서비스를 준비하고 있다. 또한 SK텔레콤은 이보다 앞선 2022년 6월 국내 최초로 대규모 인공지능 모델 GPT-3을 적용한 인공지능 서비스 ‘에이닷’을 출시했다. 이는 챗GPT에 활용된 GPT-3.5보다는 한 단계 낮은 인공지능 모델이다. 카카오 자회사 카카오브레인이 2021년 공개한 한국어 특화 인공지능 모델 ‘KoGPT’도 GPT-3이다. 안타깝게도 GPT-3이 활용된 에이닷 등 국내에서 상용화된 챗봇은 아직까지 대화가 어색하다는 평가를 받는다. GPT는 실수를 했을 때 이에 대해 사용자로부터 피드백을 받아 언어모델을 계속 정교화 하는 과정을 거치는데, GPT-3은 아직 학습이 부족한 상황이다.

따라서 에이닷 등을 사용해보면 기본적인 대화는 가능하지만 챗GPT와 같이 전문적인 내용의 글 작성은 불가능하다. 바로 이러한 점이 챗GPT가 극찬을 받고 있는 가장 큰 이유이며 이는 기존의 검색기능을 대체할 수 있을 만큼의 수준 높은 정보를 제공할 수 있다. 그러나 국내에서는 아직 이정도 성능 구현은 불가능한 상태인 듯 보인다. 결국 국내기업들이 오픈AI의 챗GPT와 같은 수준의 서비스를 제공하기 위해서는 방대한 데이터를 학습시켜야 하는데, 여기에는 엄청난 시간과 비용이 필수적이다.

오픈AI의 챗GPT 역시도 현재 테스트 버전임에도 불구하고 매일 20억 원에 가까운 비용이 들고 있는 것으로 알려져 현재로서는 ‘돈 먹는 하마’인 셈인데, 이 때문에 마이크로소프트로부터 100억 달러(약 12조 원)의 추가 투자를 받는 것이 절실한 상황이라는 보도도 있다. 여기에 챗GPT는 월 구독료로 40달러 정도를 받는 수익모델을 검토하고 있다고 한다. 향후 유료화 되었을 때 지금과 같은 이용자를 유지하기는 쉽지 않을 수도 있을 거라는 예상도 해볼 수 있다. 따라서 아직은 기술의 업그레이드나 좀 더 대중화될 수 있도록 흥행에 성공한 오픈AI조차도 챗GPT 서비스 운영에 부담이 커서 빅테크의 지원을 받아야 하는 상황임을 감안해야 한다. 국내 기업들이 수익성을 장담할 수 없는 챗봇에 막대한 금액의 투자를 하며 진행하기가 쉽지 않을 것이라는 예측들이 많다.

다만 KT 등 국내기업들은 일정한 전문분야에 한해서 대답해주는 챗봇 서비스를 준비하고 있는데, 그것은 인공지능이 세상의 모든 지식을 학습하기는 어렵겠지만 법률, 의료, 회계 등으로 학습할 데이터를 좁힌다면 훨씬 수월하게 성능을 높일 수 있기 때문이다. 이미 챗GPT를 활용하여 미국의사면허시험(USMLE)과 미네소타대학교 로스쿨 시험에 합격할 수 있다는 실험 결과가 나온 만큼, 전문분야에서 인공지능을 활용하는 방안에 착안했다는 KT 관계자의 말이다.

한편 사람은 텍스트를 읽고 원리를 이해하는 식으로 답변을 찾아 나가지만 챗GPT는 통계적으로 가장 그럴듯한 단어를 그때 그때 차례로 생성하는 방식을 쓴다. 따라서 인공지능이 무엇인가를 이해해서 설명하는 것이 아닌 만큼 사람이 보기에는 어색한 답변도 얻게 되는데 이를 해결하기는 쉽지 않다는 것을 챗GPT 스스로 자신의 한계점이라 밝히고 있다. 일반 상식 부족, 편향과 편견, 제한된 전후사정과 기억, 악의적 입력에 취약한 등, 예상치 못했거나 또는 통계가 부족할 시 무의미한 대답을 생성할 수 있다. (<글로벌 챗GPT 열풍, KT SK텔레콤 개발 한국형 챗봇 어디까지 왔나>, 비즈니스포스트, 재인용)

결국 조금 더 설명해 보면, AI 기반 챗봇을 구현하기 위한 핵심기술은 사용자들이 채팅창에 입력하는 문장을 잘 분석하고 이해한 뒤 필요한 업무를 정확하게 수행하는 일이다. 이를 위해 먼저 문장을 최소 단위의 형태소로 쪼개어, 예를 들면 ‘오늘 서울 날씨를 알려줘’라는 문장이 있으면 오늘, 서울, 날씨, 알려, 줘 등으로 나눈다. 다음으로는 시멘틱 분석(컴퓨터가 정보자원의 뜻을 이해하고, 논리적 추론까지 할 수 있는~)을 통해 문장에 포함된 형태소들과 같은 말이나 반대 말을 파악한다. 엔터티 분석(업무에 필요하고 유용한 정보를 저장하고 관리하기 위한 집합적인 것~)에서는 문장 속 단어들을 파악해 실제 뜻을 파악한다. 최종적으로 자연어 이해 단계에서는 사용자가 요청한 사안을 확인해 필요한 업무를 수행하게 되는 과정을 거치게 된다. 이 유형은 기존의 인공지능 비서라 불리는 애플 시리나 MS 코타나 등과 다를 바 없는 유형이라 할 수 있다. 다만 오픈AI의 개발기술과 국내기업들이 개발한 기술과 어떤 차이가 있는지는 정확히 알 수는 없지만 위에서 언급된 SK텔레콤의 에이닷(GPT-3) 수준을 훨씬 능가한 것은 확실해 보인다.

그러나 늘 소비자 트렌드를 이해하고 또 그에 따른 전략을 수립해야 하는 마케터들에게는 이렇게 새로운 기술이 세상에 나타나게 되면 ‘어떤 방향으로 소비자들에게 접근시켜야 보다 빠른 확산과 매출증가, 또 소비자 인식을 전환시킬 수 있을까‘에 대한 고민이 숙명과도 같은 것이라 깊이 있는 고민은 있어야 할 것 같다. 과거 단순한 채팅만을 하던 것이 이제는 본격적으로 마케팅으로 활용되는 시절이 온 것이라는 점에서 현장의 마케터들은 많은 연구가 필요할 것이다. 소비자들이 가장 간편하게 챗GPT를 활용할 방법들과 접근성을 연구해야 할 텐데, 현장의 마케터들은 챗GPT를 사용하면 자신들의 역량을 더 높일 수 있다는 생각에 호의적이다.

그들은 챗GPT가 문서를 편집하고, 제안을 하고, 아이디어를 요약하고, 전반적인 카피 가독성을 향상시키는데 사용해 기존 콘텐츠를 향상시키며 이상적인 키워드와 태그를 조사해 검색 엔진 최적화 전략을 강화할 수 있다고 생각한다. 특히, 마치 전문가가 쓴 듯 빈틈없는 정보 전달과 함께 세련된 유머까지 겸비한 챗GPT의 광고 문구가 실제 광고에 그대로 삽입되면서 AI의 무한한 가능성과 잠재력을 확인시킨 사례가 있다. 따라서 어느 마케터가 이러한 오픈AI를 활용하지 않을까 라고 되묻고 싶을 정도로 마케터들에게 챗GPT는 무한한 기회가 될 수도 있다.

뿐만 아니라 채팅이 가능하기 때문에 기업들은 챗GPT를 훈련시켜 자주 묻는 질문에 대해 응답하고 고객과 인간적인 대화를 하도록 할 수 있다. 이를 통해 인건비 부담을 줄이고 연중무휴로 고객 지원을 제공할 수 있는 건 큰 장점이라 할 수 있다. 그렇지만, 전문가들은 기업들이 조만간 새로운 도구에 대한 정책을 숙고할 필요가 있다고 말하고 있다. 그렇지 않으면 사실 오류, 저작권 침해, 민감한 회사 정보 유출과 같은 부문에서 불이익을 감수해야 할 수도 있다는 것인데, 이는 마케터뿐 아니라 여러 주요기관에서 이미 우려하고 있는 바이며 이에 대한 대비를 충분히 준비해야 할 것이다.

인공지능으로 인해 기술의 발전 속도는 이미 우리가 예상하는 그 이상으로 빨리 변화하고 있다. 그래서 일부 전문가들은 인간 노동자들이 이 기술에 의해 대체되기까지 불과 몇 년 밖에 남지 않았다고 예상하고 있다. 하지만 역사적으로 문명의 이기(利器)가 발전되는 곳은 늘 양면성을 지닌다는 진실을 외면할 수는 없다. 인공지능(AI)의 발달 역시도 인간의 사고와 정서에까지도 맞닿아 있기에 이를 개발하고 사용하는 인간들의 본성이 어느 쪽으로 흘러 가느냐에 따라 인류는 편리함을 넘어 영화에서처럼 생존을 위협받을 수도 있을 것이다. 따라서 인공지능의 발전은 인류를 위해 긍정적이고 올바른 방향으로 가야할 것이며, 이제 시작된 챗GPT(ChatGPT) 역시도 긍정적 활용과 더불어 무한한 발전을 기대해 본다.

Gil Park님의 브런치에 게재된 글을 모비인사이드가 한 번 더 소개합니다.