오픈AI, 새로운 이미지 생성 AI 모델 출시 ..."더 직관적이고 정교하게"

[서울=뉴스핌] 최원진 기자= 챗GPT 개발사 오픈AI가 25일(현지시간) 더 강력해진 새로운 이미지 생성 인공지능(AI) 모델 '챗GPT-4o(포오) 이미지 생성'을 출시했다.
이 모델은 기존 멀티모달 AI 모델인 '챗GPT-4o'와 결합한 것으로, 텍스트와 이미지를 통합한 첫 모델이다.
기존에는 이용자가 원하는 이미지 생성을 위해 프롬프트 하나하나 입력해야 했지만, 새 모델은 이용자의 의도를 파악해 기존의 '달리'(DALL-E) 모델보다 더 직관적이고 정교하게 이미지를 생성해 낸다.
오픈AI는 "우리는 온라인상 이미지와 텍스트가 결합된 데이터를 바탕으로 모델을 훈련했다. 이를 통해 이미지가 언어와 어떻게 관계되는지뿐만 아니라 이미지끼리 어떻게 관계되는지도 학습했다"라며 "이 모델은 놀라운 시각적 유창성을 가지며, 유용하고 일관되게 문맥을 인식하는 이미지를 생성할 수 있다"라고 설명했다.
예를 들어 기존에는 자전거 이미지 생성은 문제가 없지만 세모난 바퀴가 달린 자전거를 생성해달라고 하면 삼각형 바퀴는 훈련되지 않은 데이터라 원하는 결과를 얻기 어려웠다.
하지만 새 모델은 참고 이미지를 첨부하고 대화체로 설명하면 손쉽게 원하는 이미지를 생성해 낸다.
다른 이미지 생성 모델의 경우 최대 5~8개 물체를 이미지로 생성하는 데 한계가 있지만, GPT-4o 모델의 경우 10~20개의 서로 다른 물체를 이미지로 생성할 수 있는 강점이 있다.
4o 이미지 생성 모델은 이날부터 챗GPT 프로, 플러스, 팀 등 유료 가입자와 무료 가입자 모두 사용할 수 있다.
![]() |
오픈AI가 25일(현지시간) 출시한 '챗GPT-4o 이미지 생성' 모델의 구동 예시. [사진=오픈AI 홈페이지] |