챗 GPT란 무엇인가?
ChatGPT란?
ChatGPT란 OpenAI가 개발한 GPT-3.5 기반의 대형 언어 모델(large language model, LLM) 챗봇을 뜻합니다. ChatGPT는 대화 형태로 상호작용을 하며 놀라울 정도로 인간과 대화하는 것과 같은 반응을 제공하는 능력을 가지고 있습니다.
대형 언어 모델 (large language model, LLM)은 일련의 단어에서 다음 단어를 예측하는 작업을 수행합니다.
또한 ChatGPT는 인간 피드백형 강화학습 (Reinforcement Learning w/ Human Feedback, RLHF)을 사용하는데요, 이는 사용자의 지시를 따르고 만족스러운 반응을 생성하는 능력을 만들기 위해 인간 피드백을 사용하는 추가 훈련 계층입니다.
누가 ChatGPT를 만들었을까?
ChatGPT는 샌프란시스코에 기반을 둔 인공지능 회사인 OpenAI에 의해 만들어졌습니다. OpenAI는 DAL·E라는 텍스트 명령에서 이미지를 생성하는 딥 러닝 모델을 만든 회사로 유명합니다 Y Combinator의 사장이었던 Sam Altman이 현재 CEO로 재직중이며 마이크로소프트는 10억 달러 규모의 파트너이자 투자자입니다. 그들은 또한 Azure AI 플랫폼을 공동으로 개발했습니다.
ChatGPT 원리: LLM & RLHF
ChatGPT의 원리는 크게 대형 언어 모델(Large Language Model, LLM)와 인간 피드백형 강화학습 (RLHF) 로 나뉩니다.
대형 언어 모델(LLM)은 문장에서 다음에 오는 단어를 정확하게 예측하기 위해 방대한 양의 데이터로 훈련되는데요. 데이터의 양을 늘리면 언어 모델의 수행 능력이 증가하는 것으로 나타났습니다.
스탠포드 대학에 따르면 GPT-3는 1,750억 개의 매개 변수를 가지고 있으며 570기가바이트의 텍스트에 대해 교육을 받았습니다. 이는 전작인 GPT-2는 15억 개의 매개변수에 100배 이상 해당되는 수치입니다.
대형 언어 모델 (LLM)은 문장의 일련의 단어로 다음 단어를 예측하고 다음 문장을 예측합니다. 즉, 자동 완성과 유사하지만, 여러분을 사로잡는 정도로 예측합니다. 이 기능을 통해 사용자들은 단락 뿐만 아니라 여러 페이지의 콘텐츠를 작성할 수 있습니다. 그러나 대형 언어 모델 (LLM)은 인간이 원하는 것을 항상 정확히 이해하지 못한다는 점에서 한계가 있습니다.
이 한계점은 이는 앞서 언급한 인간 피드백형 강화학습 (RLHF)훈련을 통해 기술 수준이 개선 가능한데요. 이 훈련을 통해 ChatGPT는 사용자의 지시를 따르고 만족스러운 반응을 생성하는 능력을 만들 수 있습니다.
ChatGPT는 어떻게 훈련되었을까?
GPT-3.5는 ChatGPT가 대화를 학습하고 인간과 같은 대응 방식을 달성할 수 있도록 돕기 위해 온라인 커뮤니티 내 토론과 같은 소스를 포함하여 인터넷의 코드 및 정보에 대한 방대한 양의 데이터를 통해 훈련되었습니다.
ChatGPT는 또한 인간 피드백(인간 피드백을 이용한 강화 학습이라는 기법)을 활용해 훈련해 인간이 질문할 때 기대하는 것을 학습했습니다. 이러한 방식으로 대형 언어 모델 (LLM)을 훈련하는 것은 단순히 다음 단어를 예측하기 위한 훈련을 넘어서기에 혁신적이라 볼 수 있습니다.
ChatGPT의 제한 사항
유독성 반응에 대한 한계
ChatGPT는 유독하거나 유해한 반응을 제공하지 않도록 프로그램되어 있습니다. 그래서 ChatGPT는 그러한 종류의 질문에 답변을 제공하지 못합니다.
부정확한 답변 제공
또 다른 한계는 사용자가 옳다고 생각하는 답을 제공하도록 훈련되었기 때문에 제공한 답변이 사용자를 속일 수 있다는 것입니다.
많은 사용자들은 ChatGPT가 잘못된 답을 제공할 수 있다는 것을 발견했으며, 일부는 매우 부정확한데요.
예시로 코딩 Q&A 웹사이트인 Stack Overflow의 관리자들은 인간이 옳다고 느끼는 답변이 초래한 의도하지 않은 결과를 발견했습니다. Stack Overflow 웹사이트는 ChatGPT에서 생성된 답변으로 넘쳐났지만, 대부분의 답변은 잘못된 것 이였습니다.
OpenAI가 설명하는 ChatGPT의 한계
OpenAI는 다음과 같은 경고를 했습니다
OpenAI 로고
“ChatGPT는 때때로 그럴듯하게 들리지만 부정확하거나 말도 안 되는 대답을 제공합니다.
다음과 같은 문제를 해결하는 것은 어렵습니다:
(1) 강화학습 훈련 중에는 사실의 원천 (source of truth)을 기반으로 하지 않습니다
(2) 모델에게 더 신중하게 행동하도록 훈련을 시키면 모델은 올바르게 답변할 수 있는 질문을 거부하게 됩니다
(3) 지도 훈련은 모델을 잘못 인도합니다. 왜냐하면 이상적인 대답은 인간 시연자가 알고 있는 것이 아니라 모델이 알고 있는 것에 달려 있기 때문입니다.“
챗봇은 현재 AI가 질문에 더 잘 대답하고 실수로부터 배울 수 있도록 사용자가 시도하고 응답에 대한 피드백을 제공할 수 있도록 개방되어 있습니다.
공식 발표에 의하면 ChatGPT는 AI의 실수에 대한 피드백을 받기를 열망합니다:
“우리는 모델이 부적절한 요청을 거부하도록 노력했지만, 모델은 때때로 해로운 지시에 반응하거나 편향된 행동을 보일 수 있습니다.
Moderation API를 사용하여 특정 유형의 안전하지 않은 콘텐츠를 경고하거나 차단하고 있지만, 현재로서는 잘못된 부정 및 긍정이 있을 것으로 예상됩니다.
우리는 이 시스템을 개선하기 위한 지속적인 작업을 돕기 위해 사용자 피드백을 수집하고 싶습니다.”
또한 OpenAI는 무료 서비스를 유지하면서 월 20달러의 유료버전인 ChatGPT Plus를 출시했는데요. 기존 무료 서비스와 다른 점은 사용자는 챗봇을 24시간 사용 가능, 더 빠른 응답과 새로운 부가 기능 등을 제공한다는 것 입니다.
언어 모델이 구글 검색을 대체할 것인가?
기술은 아직 갈 길이 멀지만, 검색과 챗봇의 하이브리드 검색 형태를 상상하는 것은 가능하다 보입니다.
구글은 이미 람다(LaMDA)라는 AI 챗봇을 만들었습니다. 구글 챗봇의 성능은 사람의 대화에 매우 가까웠기 때문에 구글 엔지니어는 람다(LaMDA) 가 지각이 있다고 주장했습니다. 하지만 이것은 거짓으로 밝혀지며 해당 엔지니어는 해고가 되었습니다.
그럼에도 불구하고, 이러한 대형 언어 모델이 많은 질문에 답할 수 있다는 점을 고려할 때, OpenAI, 구글 또는 마이크로소프트와 같은 회사가 언젠가 전통적인 검색 엔진을 AI 챗봇으로 대체할 것이라는 것은 억측일까요?
2월 초 마이크로소프트는 자사 검색엔진인 Bing에 ChatGPT를 접목했습니다. 이후 사용자들의 이목을 끌며 앱스토어에서 평소보다 10배 이상의 다운로드 수를 불러 일으켜 ChatGPT의 인기를 실감할 수 있습니다. 하지만, ChatGPT를 사용하신 분들 중 ChatGPT의 미숙한 기능때문에 ‘챗봇이 검색의 대안이 될 것’이라는 두려움을 떨치신 분들이 많을 것 입니다. 그래도 이전에 말씀드린 대형 언어 모델의 이점을 통해 검색과 챗봇의 하이브리드 검색 형태는 충분히 가능하다 보입니다. 또한 SEO 측면에서 AI 챗봇을 통해 콘텐츠 제작 까지 가능한데요. ‘ChatGPT, 콘텐츠 SEO에 도움이 될까?’를 통해 ChatGPT가 구글 검색 엔진에 어떠한 영향을 미치는지 알 수 있습니다.
ChatGPT는 어떻게 활용될 수 있을까?
ChatGPT를 통해 특정 작가의 스타일로 시, 노래, 심지어 단편을 작성할 수 있습니다.
또한 지시사항에 대한 여러분의 전문성은 ChatGPT를 정보 소스에서 작업 수행을 요청할 수 있는 도구로 향상시킵니다.
이것은 사실상 모든 주제에 대한 에세이를 쓰는 데 유용하게 만들며 기사 또는 소설 전체에 대한 개요를 생성하는 도구로 사용할 수 있게 만듭니다. 마지막으로 ChatGPT는 서면 텍스트로 답변할 수 있는 거의 모든 작업에 대한 응답을 제공합니다.
ChatGPT의 장점:
다양한 주제와 질문에 대한 이해: ChatGPT는 사전 훈련된 대규모 데이터셋을 기반으로하여 다양한 주제와 질문에 대한 이해를 갖추고 있습니다. 이는 사용자가 다양한 종류의 질문을 제기할 수 있고, 다양한 주제에 관련된 정보를 얻을 수 있다는 장점으로 작용합니다.
자연스러운 대화 생성: ChatGPT는 문맥을 이해하고 이를 활용하여 자연스러운 대화를 생성할 수 있습니다. 이는 사용자가 대화 형식으로 질문하고 대화를 이어나갈 수 있어 더욱 유연하고 개인화된 경험을 제공할 수 있다는 장점입니다.
응답의 창의성: ChatGPT는 대화 생성에 창의성을 발휘할 수 있습니다. 때로는 예상치 못한, 창의적인 답변을 제공하여 새로운 아이디어를 도출하거나 색다른 관점을 제시할 수 있습니다.
사용자 경험 개선: ChatGPT를 활용하면 기업이나 서비스 제공자는 고객과의 상호작용을 향상시킬 수 있습니다. 대화형 인터페이스를 통해 개인화된 서비스를 제공하고, 실시간으로 질문에 응답하며 고객 문의나 문제 해결을 지원할 수 있습니다.
ChatGPT의 단점:
정보의 정확성 보장 어려움: ChatGPT는 훈련 데이터를 기반으로 작동하기 때문에, 정확한 정보를 항상 보장할 수 없습니다. 잘못된 정보를 전달할 수 있거나, 훈련 데이터에 있는 편견이 반영될 수도 있습니다.
응답의 일관성과 신뢰성 문제: 가끔씩 ChatGPT는 문맥을 일관되게 유지하지 못하거나 일관성 없는 응답을 생성할 수 있습니다. 때로는 같은 질문에 대해 다른 응답을 제공하기도 합니다. 이는 신뢰성에 영향을 미칠 수 있으며, 사용자는 결과를 검증하기 위해 추가적인 자료나 출처를 확인해야 할 수도 있습니다.
악용 가능성: ChatGPT는 텍스트 생성을 기반으로 한 모델로서, 악용될 수 있는 가능성도 있습니다. 악의적인 사용자가 모델을 이용하여 거짓 정보를 만들거나, 혐오적인 콘텐츠를 생성하는 등의 문제가 발생할 수 있습니다. 이러한 문제를 관리하기 위해서는 모델의 사용 규칙과 필터링 기술 등이 필요합니다.
이러한 장점과 단점을 고려하여, 적절한 상황에서 ChatGPT를 활용함으로써 더 나은 사용자 경험과 대화 형식의 상호작용을 구현할 수 있습니다.