2023.03.14일자 GPT-4 공개
OpenAI(오픈AI)의 GPT 시리즈 4번째 모델인 GPT-4가 샌프란시스코 기준 2023년 3월 14일 (어제) 오전 10시에 공식 발표되었고, 오늘 현재 기준으로 OpenAI의 사이트에서 유료 구독 서비스인 'ChatGPT Plus (챗GPT 플러스)' 를 통해 사용할 수 있다고 합니다.
IT 블로거인 로버트 스코블(Robert Scoble)과 같은 AI 전도사는 "GPT-4는 사람들이 기대하는 것 이상이다."라고 주장하기도 했다고 하여, 저도 실제 사용이 기다려지고 있습니다.
GPT-4, 주요 업데이트 사항은?
기존 GPT-3.5를 업무나 일상 생활 등에 잘 활용하고 계신 분들은 그래서 어떤 점이 바뀐건데?가 가장 궁금하실 겁니다.
1. 이미지/영상 설명 기능 - 추론도 가능
나무위키나 워싱턴포스트 등 언론자료를 통해 확인한 결과, 가장 큰 차이점은 '이미지 설명' 기능이라고 합니다. 예를 들어 한 쪽에 공이 있는 나무로 된 시소에서 건너편 위쪽에 권투 글러브가 매달려 있는 사진을 보여주면서 "이 사진에서 글러브가 나무에서 떨어진다면 어떻게 될까?"를 물어보면 GPT-4가 "시소에 글러브가 떨어져 반대편의 공이 위로 튀어오를 것입니다."라고 답변할 수 있는 수준이라고 합니다. (The Washington Post)
이런 기능은 다수의 이미지에 대해 자동으로 캡션을 붙일 때 유용하게 사용할 수 있을 것으로 보입니다. (물론 다른 응용 방식도 무궁무진하겠죠!)
샌프란시스코 GPT 연구실에서는 텍스트-이미지 간 "multimodal" 학습 방식과 "advanced reasoning capabilities (향상된 추론 능력)"를 사용해 기존의 'Chat box' 역할에서 벗어나 색깔과 이미지의 영역으로 ChatGPT의 기능을 확장할 수 있었다고 설명하고 있습니다.
* 그러나 현재(3월 15일 기준) 유료 구독서비스인 ChatGPT Plus(월 구독료 20달러)를 사용하더라도 아직은 GPT-4의 텍스트 기능만 사용이 가능하다고 하는데요, 이는 현재 새롭게 추가된 이미지 설명 기능이 남용 또는 오용될 우려가 있어 이러한 문제를 검토하고자 출시일을 미루고 있다고 합니다. 예를 들어, 특정 사람의 사진을 입력할 경우 혹시나 다양한 빅데이터를 학습한 GPT-4가 개인정보를 출력하지는 않을지 등에 대한 추가적인 검토가 필요하다는 것입니다. 이미지 설명 기능이 출시되면, 어떤 수준일지 꼭 사용해보고 싶네요.
덧붙여, 영상에 대한 내용 요약 및 답변도 가능하다고 합니다. 이 서비스는 일반인이 사용할 수 있도록 공개되지는 않았으나, OpenAI측은 GPT-4를 사용해 인터넷 상의 영상이나 촬영된 영상에 대해 상세한 설명을 하거나, 이를 응용하여 추천하는 Be My Eyes 서비스를 구축했다고 합니다.
2. 더 긴 텍스트 처리 가능
OpenAI측은 새로운 모델이 영문 기준으로 25,000단어 (기존 GPT3.5는 3,000개 단어) 이상의 텍스트를 처리할 수 있어 처리 단어량이 약 8배 이상 확대된다고 밝혔습니다.
3. 헛소리나 위험한 답변 개선
나무위키에 따르면, 이번 GPT-4가 보안, 사회 안전 등과 관련하여 위험한 질문에 대해 답변하지 않도록 하는 안전 필터를 강화하였고, 오류를 자신있게 말하는 문제를 개선했다고 합니다.
오픈AI는 AI 보정, 사이버보안, 의학, 사회 안전 등 다양한 분야 전문가 50명과 함께 AI 모델이 위험한 답변을 하지 않도록 한층 강화한 안전 필터를 만들어 GPT-4에 적용했다. 이를 통해 AI 모델이 허용되지 않는 요청에 대한 답변에 응답하는 경향을 82% 줄였다.
AI가 사실과 다른 것을 마치 진실인 것처럼 강한 확신을 담아 답변하는 문제를 이전 모델보다 40% 높은 점수를 받아 환각 오류를 상당 부분 줄이는 데 성공했다.
4. 언어능력(글쓰기) 개선 - 전문성 강화, 요약 능력 향상
GPT-3.5는 미국 변호사 시험에서 400점 만점에 213점을 받았지만, GPT-4는 400점 만점에 298점을 받아 법률 지식을 한층 끌어올렸다. (특히 세금 계산을 매우 빨리 실행해 최고점을 받았다고 합니다.)
미국 수학능력시험인 SAT의 경우 읽기 및 쓰기의 경우 800점 만점 기준 670점에서 710점으로 향상됐고, 특히 GPT-3.5의 약점으로 지적받은 수학 능력의 경우 590점에서 700점으로 크게 향상됐다. 의학지식 자가 진단도 정답률이 53%에서 75%로 향상됐다.
5. 유머 감각 추가
유머 감각이 없어 조금은 로봇같이 느껴졌던 GPT-3.5의 단점을 보완하여, 약간의 유머 감각이 추가되었다고 합니다...!
주어진 주제에 대해 새로운 농담을 제안할 수 있게 되었다고 합니다. 뉴욕타임즈(New York Times) 기사 상 예시로는, GPT-4에게 "마돈나가 기하학을 배우는 이유는?" 이라고 질문하였더니, "모든 가능한 각도로 포즈를 취할 수 있게 하려고."라고 답변했다고 합니다.
한계점
물론 GPT-4도 한계가 아직 있습니다. GPT4는 여전히 헛소리나 편견이 반영된 답변을 출력할 수 있고, training data 기간인 2021년 9월 이후 발생한 사건에 대해서는 답변에 반영되지 않을 수 있다고 OpenAI 측은 말하고 있다고 합니다. AI 언어 모델이 실제 사실이 아닌 문구를 설득력 있게, 자신 있게 제시하는 경우가 발견되기도 했기 때문에, GPT-4의 결과를 무조건 신뢰하여 사용하는 것은 지양해야 할 것으로 보입니다. (실제로 디x인사이드의 유일한 ChatGPT 정보공유 커뮤니티에서는 성적인 농담 등에 ChatGPT를 주로 사용하는 것을 볼 수 있었습니다.)
또 한 가지 문제로는, ChatGPT는 우리가 기존 사용하는 구글 등 검색 엔진과 달리 하나의 답변을 제시하기 때문에, ChatGPT의 답변 방향에 따라서 사람들의 상식이나 생각이 한 방향으로 편중되는 현상이 더욱 심해질 수 있다는 생각이 듭니다.
'ChatGPT & AI' 카테고리의 다른 글
[ChatGPT] 과제에 ChatGPT 활용하기 - 소제목/카피 작성 아이디어를 달라고 요청해보자! (3) | 2023.03.18 |
---|---|
[ChatGPT활용법] 알고 쓰면 분야별/업무별 효율성을 더욱 증대시킬 수 있어요 (0) | 2023.03.15 |
댓글