뉴스투데이정슬기 아나운서

[이 시각 세계] 오픈AI, '보고 듣고 말하는' 새 AI 모델 출시

입력 | 2024-05-14 06:54   수정 | 2024-05-14 06:54

Your browser doesn't support HTML5 video.

이 시각 세계입니다.

생성형 인공지능 ′챗GPT′를 개발한 오픈AI가 좀 더 진화된, 보고 듣고 말하는 새로운 AI 모델을 선보였습니다.

″시연 무대에 나와서 좀 긴장되는데 어떻게 해야 진정이 될까? <지금 시연하시는 거예요? 멋지네요! 숨을 깊게 들이마셔 보세요.>″

현지시간 13일 오픈AI사가 새롭게 선보인 ′GPT-4o′(GPT-포오)AI 모델 시연 영상입니다.

발표자가 긴장한 상태인데 어떻게 진정할 수 있을지 묻자, AI가 숨을 깊이 들이마시라고 조언하는 모습인데요.

글로 써서 대화했던 기존 모델과 달리, 이용자와 실시간 음성 대화를 통해 질문하고 답변을 요청할 수 있습니다.

AI가 청각과 시각으로 추론하고 이를 말할 수 있도록 기능이 한층 업그레이드됐는데요.

종이에 적힌 수학 문제를 보여주고 풀어달라고 하자, 시각기능을 이용해 이를 단계별로 풀어내기도 했습니다.

′GPT-4o′ 모델은 지난해 11월 나온 GPT-4 터보보다 2배 더 빠르고 비용은 2분의 1 수준인데요.

몇 주 안에 무료 버전도 공개될 예정입니다.