1. GPT란?
지금까지 사람이 소프트웨어를 개발한 후 INPUT을 넣으면 그 프로그램에 따라 결과 OUTPUT이 도출되었다면, 딥러닝에서는 데이터를 트레이닝 시키고 그 중간 인공지능 훈련 단계에서 사람이 개입하고 나면 이 후에는 알아서 소프트웨어를 만들어낸다는 것입니다.
쉽게 말하자면, 예전에는 하나의 공식처럼 A를 넣으면 B라는 단순한 공식에 의해 운영되던 프로그램이었는데, 딥러닝에서는 무수한 데이터와 공식(알고리즘)을 학습한 후 상황과 문제에 맞게 A에 대한 연관 결과를 뽑는 다고 볼 수 있습니다.
GPT는 인공신경망을 이용한 언어모델로서 AI 네트워크가 만든 AI Writer도 GPT 2를 기반으로 하여 만들어졌습니다. GPT는 1, 2, 3번째 버전에 이어 3.5까지 공개된 상황으로 멀지 않은 시일에 GPT4를 기다리고 있습니다. 잠시 인공신경망에 대해 덧붙여보겠습니다.
인공신경망, 인공지능이 언어 모델을 발전시키는 방법
언어는 인간과 다른 동물을 구별하는 가장 큰 사회적 도구입니다. 그런데 인공지능이 말을 배운다?
인공지능이 언어모델을 발전시키는 방법은 크게 2가지가 있습니다.
(1) 사람의 언어를 통계로 이용하는 방법이 있고,
(2) 인공 신경망을 이용하는 방법이 있습니다.
단순하게는 우리가 입력하는 단어의 그 다음 단어가 무엇일지 예측하는 아래와 같은 언어모델에서 이제 사람처럼 글을 쓰고 말을 하는 수준에 이르고 있습니다.
2. 발전과정
GPT 언어모델은 자연어를 처리하는데 기반이 되는 조건부 확률 예측 도구입니다. 사람처럼 문장을 이해하고 써 내려가는게 아닌, 여러가지 텍스트 데이터를 분석하여 적절한 문장을 만들어내는 것에 가깝습니다. 우리가 어떤 키워드를 입력하면 그 키워드와 과련된 다른 모든 자료를 취합하여 사람이 요구하는 텍스트를 만들어 내는 방식입니다.
그럼에도 불구하고 인간과 구분할 수 없는 글을 쓸 수 있는 비결은 엄청난 학습량 덕분입니다.
학습 매개 변수의 증가 및 차이점
GPT 1 : 1억 1700만개
GPT 2 : 15억개 (이전 대비 10배) - 인간과 유사한 수준의 글쓰기로 책 한페이지 작성에 단 10초 소요
GPT 3 : 1750억개 (1버전 대비 1000배, 2버전 대비 100배 이상) - 각종 언어 관련 문제풀이, 간단 사칙연산, 랜덤 글짓기, 간단 코딩, 번역 등
GPT 3.5(챗GPT) : GPT4로 넘어가기 전의 베타버전 - 답변 오류 대폭 수정, 사람과 대화하는 듯한 흐름, 고학력 비서 수준, 논물, 연설물, 음악 창작, 프로그래밍 언어로 언어 개발 가능
초기 모델이었던 GPT-1이 2018년에 탄생한 것에 이어 이듬해 GTP-2, 그리고 다시 1년 뒤 2020년 GPT-3에 이르기 까지 이미 세계적인 작가를 놀라게 할만 했던 GPT였지만, 무려 570GB의 방대한 자료 학습에도 가끔 대화과정에서 맥락이 맞지 않거나 이상한 표현과 문장을 쓰는 사례들이 있었습니다.
이에 이러한 점을 보완하고자 나온 것이 GPT-3.5이자 챗GPT로 GPT-4로 넘어가기 전 베타버전입니다. 엄청난 인력을 투입하여 이상한 답변을 수정, 평가해 오류를 대폭 감소하였고, 덕분에 챗GPT는 마치 사람과 사람이 대화하는 듯한 착각을 일으킬 정도입니다.
AI가 모든 인류의 지적 능력 합계를 뛰어넘는 이른바 '특이점'(Singularity)이 머지 않았다는 반응들도 일고 있습니다.
3. 챗 GPT, GPT-3.5 현 상황
1) 챗 GPT의 강점
챗GPT는 광범위한 분야의 논문과 과제를 굉장히 높은 수준으로 작성할 수 있고 연설문도 쓸 수 있습니다. 또한, 소설이나 시, 음악을 창작하거나 프로그래밍언어로 애플리케이션을 개발하는 것도 가능합니다. 최근 미국 로스쿨과 명문 경영대학원(MBA) 시험에서 챗GPT로부터 얻은 답변을 제출하여 합격점을 받았다는 이야기가 전해지기도 했습니다. 이에 대한 우려도 있으나 부정행위를 막는데 그칠게 아닌, 이를 적극적으로 활용하여 교육과정에 접목해야한다는 움직임도 나타나고 있습니다.
2) 챗 GPT의 이용자 급상
챗GPT 이용자도 빠르게 증가했습니다. 미국 자산 운용사 아크 인베스트먼트의 브렛 윈튼 최고미래부분 책임자는 SNS에 '인스타그램이 355일 만에 일 평균 일간활성이용자(DAU) 수 1000만명을 넘겼는데, 챗GPT는 출시한 40일만에 이 수치를 달성했다'고 전했습니다.
3) 구글 위기 경고 '코드레드'
세계 최대 검색엔진 업체인 구글은 심각한 위기 경고를 의미하는 코드레드를 발령하며, 3년 전에 회사를 떠난 공동창업자인 래리 페이지와 세르게이 브리나에게 도움을 청했습니다.
다만 챗 GPT를 다루는 법적, 윤리적 문제는 확산에 변수로 작용하고 있으며, 챗GPT를 비롯하여 생성형 인공지능은 기존의 컨텐츠를 대량으로 학습해야만 작동할 수 있기 때문에 관련 저작권 소송이 잇따르고 있습니다.
또한 챗 GPT가 만든 작품의 창작자를 누구로 봐야 하는가에 대한 논쟁거리와 함께, 일각에선 챗GPT가 가짜뉴스나, 혐오발언, 인종적, 성적 편견 등의 유해한 콘텐츠를 생산하는 도구로 활용되는 것을 우려하고 있습니다.
4. 올해 내로 다음 GPT-4 공개 예정
OPEN AI는 여러가지 결점을 보완하여 올해 안에 다음 버전인 GPT-4를 공개할 예정입니다. 매개변수 개수가 100조 단위로 폭증할 것이라는 전망과 함께 특이점이 목전에 온것을 우려하기도 합니다. 개인적으로는 걱정보다는 다가올 미래에 대한 기대와 궁금증이 더 큰 것 같습니다.
'Daily story > 이슈투데이' 카테고리의 다른 글
2023 트렌드, 평균 실종, 평균이 사라진 시대 (0) | 2023.03.06 |
---|---|
구글 바드 Bard란? 구글 인공지능 AI, 챗GPT 대항마 (0) | 2023.02.20 |
대한항공 마일리지 사용 보너스 항공권 공제 변경, 4/1 (0) | 2023.02.10 |
대한항공 마일리지, 스카이패스 딜, 사용처 확 넓혔다 (0) | 2023.02.10 |
1기 신도시 특별법 재건축 용적률 500% , 적용대상 (0) | 2023.02.08 |