Home 테크

테크

[TBWA 디지털 마케팅] ChatGPT란 무엇인가? 원리부터 활용법까지

3월 3, 2023

ChatGPT란?
누가 ChatGPT를 만들었을까?
ChatGPT 원리: LLM & RLHF
ChatGPT는 어떻게 훈련되었을까?
ChatGPT의 제한 사항
ChatGPT를 무료로 사용할 수 있을까?
언어 모델이 구글 검색을 대체할 것인가?
ChatGPT는 어떻게 활용될 수 있을까?
결론

OpenAI는 복잡한 질문에 대화식으로 답하는 ChatGPT라는 AI를 선보였습니다. 이것은 혁명적인 기술인데요, 왜냐하면 사용자가 질문을 할 때 무엇을 의미하는지 배우도록 훈련되었기 때문입니다. 많은 사용자들은 인간 수준의 응답을 제공하는 능력에 경외감을 느끼고 있으며, ChatGPT가 현재 인간이 컴퓨터와 상호 작용하는 방법을 변형하면서 정보 검색 방법을 바꿀 수 있는 힘을 갖게 될 수도 있다는 느낌을 줍니다.

ChatGPT란?

ChatGPT란 OpenAI가 개발한 GPT-3.5 기반의 대형 언어 모델(large language model, LLM) 챗봇을 뜻합니다. ChatGPT는 대화 형태로 상호작용을 하며 놀라울 정도로 인간과 대화하는 것과 같은 반응을 제공하는 능력을 가지고 있습니다.

대형 언어 모델(large language model, LLM)은 일련의 단어에서 다음 단어를 예측하는 작업을 수행합니다.

또한 ChatGPT는 인간 피드백형 강화학습(Reinforcement Learning w/ Human Feedback, RLHF)을 사용하는데요, 이는 사용자의 지시를 따르고 만족스러운 반응을 생성하는 능력을 만들기 위해 인간 피드백을 사용하는 추가 훈련 계층입니다.

누가 ChatGPT를 만들었을까?

ChatGPT는 샌프란시스코에 기반을 둔 인공지능 회사인 OpenAI에 의해 만들어졌습니다. OpenAI는 텍스트 명령에서 이미지를 생성하는 딥 러닝 모델 DAL·E를 만든 회사로 유명합니다. Y Combinator의 사장이었던 Sam Altman이 현재 CEO로 재직중이며 마이크로소프트는 10억 달러 규모의 파트너이자 투자자입니다. 그들은 또한 Azure AI 플랫폼을 공동으로 개발했습니다.

ChatGPT 원리: LLM & RLHF

ChatGPT의 원리는 크게 대형 언어 모델(Large Language Model, LLM)와 인간 피드백형 강화학습 (RLHF)로 나뉩니다.

대형 언어 모델(LLM)은 문장에서 다음에 오는 단어를 정확하게 예측하기 위해 방대한 양의 데이터로 훈련되는데요. 데이터의 양을 늘리면 언어 모델의 수행 능력이 증가하는 것으로 나타났습니다.

스탠포드 대학에 따르면 GPT-3는 1,750억 개의 매개 변수를 가지고 있으며 570기가바이트의 텍스트에 대해 교육을 받았습니다. 이는 전작인 GPT-2는 15억 개의 매개변수에 100배 이상 해당되는 수치입니다.

대형 언어 모델(LLM)은 문장의 일련의 단어로 다음 단어를 예측하고 다음 문장을 예측합니다. 즉, 자동 완성과 유사하지만, 여러분을 사로잡는 정도로 예측합니다. 이 기능을 통해 사용자들은 단락 뿐만 아니라 여러 페이지의 콘텐츠를 작성할 수 있습니다. 그러나 대형 언어 모델(LLM)은 인간이 원하는 것을 항상 정확히 이해하지 못한다는 점에서 한계가 있습니다.

이 한계점은 이는 앞서 언급한 인간 피드백형 강화학습(RLHF)훈련을 통해 기술 수준이 개선 가능한데요. 이 훈련을 통해 ChatGPT는 사용자의 지시를 따르고 만족스러운 반응을 생성하는 능력을 만들 수 있습니다.

ChatGPT는 어떻게 훈련되었을까?

GPT-3.5는 ChatGPT가 대화를 학습하고 인간과 같은 대응 방식을 달성할 수 있도록 돕기 위해 온라인 커뮤니티 내 토론과 같은 소스를 포함하여 인터넷의 코드 및 정보에 대한 방대한 양의 데이터를 통해 훈련되었습니다.

ChatGPT는 또한 인간 피드백(인간 피드백을 이용한 강화 학습이라는 기법)을 활용해 훈련해 인간이 질문할 때 기대하는 것을 학습했습니다. 이러한 방식으로 대형 언어 모델 (LLM)을 훈련하는 것은 단순히 다음 단어를 예측하기 위한 훈련을 넘어서기에 혁신적이라 볼 수 있습니다.

ChatGPT의 제한 사항

유독성 반응에 대한 한계

ChatGPT는 유독하거나 유해한 반응을 제공하지 않도록 프로그램 되어 있습니다. 그래서 ChatGPT는 그러한 종류의 질문에 답변을 제공하지 못합니다.

방향의 품질에 따른 답변의 품질

ChatGPT의 중요한 한계는 출력의 품질이 입력의 품질에 의존한다는 것입니다. 전문가의 지시(프롬프트)가 더 나은 답을 만들어내는 셈입니다.

부정확한 답변 제공

또 다른 한계는 사용자가 옳다고 생각하는 답을 제공하도록 훈련되었기 때문에 제공한 답변이 사용자를 속일 수 있다는 것입니다.

많은 사용자들은 ChatGPT가 잘못된 답을 제공할 수 있다는 것을 발견했으며, 일부는 매우 부정확한데요.

예시로 코딩 Q&A 웹사이트인 Stack Overflow의 관리자들은 인간이 옳다고 느끼는 답변이 초래한 의도하지 않은 결과를 발견했습니다. Stack Overflow 웹사이트는 ChatGPT에서 생성된 답변으로 넘쳐났지만, 대부분의 답변은 잘못된 것이었습니다.

OpenAI가 설명하는 ChatGPT의 한계

OpenAI는 다음과 같은 경고를 했습니다.

ChatGPT는 때때로 그럴듯하게 들리지만 부정확하거나 말도 안 되는 대답을 제공합니다.

다음과 같은 문제를 해결하는 것은 어렵습니다 :

(1) 강화학습 훈련 중에는 사실의 원천 (source of truth)을 기반으로 하지 않습니다.

(2) 모델에게 더 신중하게 행동하도록 훈련을 시키면 모델은 올바르게 답변할 수 있는 질문을 거부하게 됩니다.

(3) 지도 훈련은 모델을 잘못 인도합니다. 왜냐하면 이상적인 대답은 인간 시연자가 알고 있는 것이 아니라 모델이 알고 있는 것에 달려 있기 때문입니다.

ChatGPT를 무료로 사용할 수 있을까?

네, ChatGPT를 현재 무료로 사용할 수 있습니다.

챗봇은 현재 AI가 질문에 더 잘 대답하고 실수로부터 배울 수 있도록 사용자가 시도하고 응답에 대한 피드백을 제공할 수 있도록 개방되어 있습니다.

공식 발표에 의하면 ChatGPT는 AI의 실수에 대한 피드백을 받기를 열망합니다.

우리는 모델이 부적절한 요청을 거부하도록 노력했지만, 모델은 때때로 해로운 지시에 반응하거나 편향된 행동을 보일 수 있습니다.

Moderation API를 사용하여 특정 유형의 안전하지 않은 콘텐츠를 경고하거나 차단하고 있지만, 현재로서는 잘못된 부정 및 긍정이 있을 것으로 예상됩니다.

우리는 이 시스템을 개선하기 위한 지속적인 작업을 돕기 위해 사용자 피드백을 수집하고 싶습니다.

또한 OpenAI는 무료 서비스를 유지하면서 월 20달러의 유료버전인 ChatGPT Plus를 출시 계획을 밝혔습니다. 기존 서비스와 다른 점은 사용자는 챗봇을 24시간 사용 가능하고, 더 빠른 응답과 새로운 부가 기능 등을 제공하는 것입니다.

언어 모델이 구글 검색을 대체할 것인가?

기술은 아직 갈 길이 멀지만, 검색과 챗봇의 하이브리드 검색 형태를 상상하는 것은 가능하다고 보입니다.

구글은 이미 람다(LaMDA)라는 AI 챗봇을 만들었습니다. 구글 챗봇의 성능은 사람의 대화에 매우 가까웠기 때문에 구글 엔지니어는 람다(LaMDA) 가 지각이 있다고 주장했습니다. 하지만 이것은 거짓으로 밝혀지며 해당 엔지니어는 해고가 되었습니다.

그럼에도 불구하고, 이러한 대형 언어 모델이 많은 질문에 답할 수 있다는 점을 고려할 때, OpenAI, 구글 또는 마이크로소프트와 같은 회사가 언젠가 전통적인 검색 엔진을 AI 챗봇으로 대체할 것이라는 것은 억측일까요?

2월 초 마이크로소프트는 자사 검색엔진인 Bing에 ChatGPT를 접목했습니다. 이후 사용자들의 이목을 끌며 앱스토어에서 평소보다 10배 이상의 다운로드 수를 불러 일으켜 ChatGPT의 인기를 실감할 수 있습니다. 하지만, ChatGPT를 사용하신 분들 중 ChatGPT의 미숙한 기능 때문에 ‘챗봇이 검색의 대안이 될 것’이라는 두려움을 떨치신 분들이 많을 것 입니다. 그래도 이전에 말씀드린 대형 언어 모델의 이점을 통해 검색과 챗봇의 하이브리드 검색 형태는 충분히 가능하다 보입니다. 또한 SEO 측면에서 AI 챗봇을 통해 콘텐츠 제작 까지 가능한데요. ‘ChatGPT, 콘텐츠 SEO에 도움이 될까?’를 통해 ChatGPT가 구글 검색 엔진에 어떠한 영향을 미치는지 알 수 있습니다.

ChatGPT는 어떻게 활용될 수 있을까?

ChatGPT를 통해 특정 작가의 스타일로 시, 노래, 심지어 단편을 작성할 수 있습니다.

또한 지시사항에 대한 여러분의 전문성은 ChatGPT를 정보 소스에서 작업 수행을 요청할 수 있는 도구로 향상시킵니다.

이것은 사실상 모든 주제에 대한 에세이를 쓰는 데 유용하게 만들며 기사 또는 소설 전체에 대한 개요를 생성하는 도구로 사용할 수 있게 만듭니다. 마지막으로 ChatGPT는 서면 텍스트로 답변할 수 있는 거의 모든 작업에 대한 응답을 제공합니다.

활용법

OpenAI에 접속 후 ‘Try CHATGPT’ 버튼을 클릭합니다.

이미 계정이 있다면 ‘Login’을, 없다면 ‘Sign Up’ 버튼을 클릭합니다.

빨간 박스 내에 여러분의 질문을 작성합니다.

여러분의 질문에 대한 답변을 받습니다. (예시로 스티븐 킹 작가의 작품 리스트를 요청했습니다.)

리스트를 전달 받았지만 리스트 중 부정확한 정보가 존재합니다. (여러분은 ChatGPT에게 잘못된 정보에 대한 교정을 할 수 있습니다.)

활용법 예시 (시 제작)

마케팅에 대한 시를 제작할 것을 ChatGPT에 요청하였는데요. 짧은 시간 내에 위트 있게 제작했습니다.

활용법 예시 (에세이 작성)

‘마케팅 측면에서 AI 사용의 중요성’을 주제로 에세이 작성을 요청했습니다. 주장을 4가지로 나누며 마지막엔 결론까지 작성을 해내는 모습을 보입니다. 최근엔 ChatGPT를 통한 에세이 작성으로 대학교에서 A+ 성적을 낸 사례도 있습니다.

기업 실제 활용 사례

미국 금융 서비스 회사인 Bankrate는 AI가 제작한 콘텐츠를 자사 웹사이트에 발행했습니다. Bankrate는 우선 AI를 통한 콘텐츠 작성, 이후 사람이 편집, 감수 등 작업을 한 후 웹사이트에 발행했는데요. 뒷 이야기는 ‘ChatGPT, 콘텐츠 SEO에 도움이 될까?’를 통해 자세히 볼 수 있습니다.

결론

지금까지 ChatGPT의 원리, 활용법과 예시에 대해 알아보았습니다. 앞서 말씀드린 것 처럼 ChatGPT가 제공하는 내용은 부정확한 경우가 종종 발생합니다. 하지만 사용자가 명확한 디렉션을 ChatGPT에게 전달한다면 충분히 유용하게 사용할 수 있는 툴로 보입니다.

해당 글은 TBWA 데이터랩과 모비인사이드의 파트너쉽으로 제공되는 기사입니다.