최근 수정 시각 : 2025-12-22 07:00:16

gpt-image

gpt-image-1.5에서 넘어옴
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)"
{{{#!folding [ 펼치기ㆍ접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
생성형 인공지능 DALL·E · Firefly · FLUX · Gaugan2 · gpt-image · Grok Imagine · Imagen · Midjourney · Nano Banana · NAI Diffusion · Qwen-Image · Samsung Gauss Image · Seedream · Stable Diffusion · Z-Image
학습 방해 프로그램 Glaze (Nightshade) · Mist
}}}}}}}}} ||
1. 개요2. 모델 목록
2.1. gpt-image-1(4o 이미지 생성)2.2. GPT-image-1.5
3. ChatGPT 지브리풍 이미지 생성 유행

1. 개요

ChatGPT의 이미지 생성 모델 시리즈를 정리한 문서.

2. 모델 목록

2.1. gpt-image-1(4o 이미지 생성)

2025년 3월 26일, GPT-4o로 동작하는 이미지 생성 기능이 추가되었다. API명은 gpt-image-1. 이미지 생성에 디퓨전이 아닌 오토리그레시브(Autoregressive) 방식을 사용하였는데, 기존 이미지 생성보다 사용이 간편하면서도[1] 자연스러운 이미지를 만들 수 있는 뛰어난 지시 이행 능력과 퀄리티에 많은 커뮤니티가 충격에 빠졌다. 거기다 멀티모달 기반이기 때문에 텍스트 생성이 자연스러워 진 것은 덤. 영어는 말할 필요도 없고 한글도 거의 그럴싸한 수준으로까지 표기할 수 있다. DALL-E와는 완전히 다르다.[2] 공식 소개

OpenAI CEO 샘 올트먼은 27일(현지시간) 자신의 X에 "사람들이 우리의 새로운 ChatGPT 이미지를 활용해 만들어 낸 이미지를 보는 것을 좋아한다"고 밝혔다. 그러면서도 그는 "때문에 우리의 그래픽처리장치(GPU)가 녹아내리고 있다"고 덧붙였다.

올트먼 CEO은 ChatGPT 이미지가 좀 더 효율적으로 기능하는 것을 돕기 위해 일시적으로 ChatGPT 이미지의 사용을 제한할 것이라고 설명했다. ChatGPT 이미지 효과적인 기능을 위해 속도를 제한하겠다는 것이다. 실제로 이날 ChatGPT 이미지를 사용해 이미지가 생성되는 시간은 주초보다 훨씬 늘어난 상태다. ChatGPT 이미지가 생성될 때 "시간이 걸릴 수 있다"라는 메시지가 표시되는 시간이 길어졌다. #

2025년 3월 28일 ChatGPT의 GPT-4o가 업데이트 되었다. #
  • 업데이트된 내용
    • 상세한 지시, 특히 여러 요청의 프롬프트 이행 능력 향상
    • 복잡한 기술 및 코딩 문제를 해결하는 능력 향상
    • 직관력과 창의력 향상
    • 줄어든 이모지 사용

"업데이트된 GPT-4o는 지금부터 모든 유료 사용자분들께 제공됩니다. 무료 사용자분들은 몇 주 안에 만나보실 수 있습니다."라고 밝혔다. #

화제가 되면서 사용자가 몰리다 보니, 2025년 3월 30일에 샘 올트먼 CEO가 직접 "여러분 제발 이미지 생성 좀 적당히 해주세요 이거 진짜 미쳤어요 우리 팀도 잠 좀 자자구요"라고 X에 글을 올렸다.#

이미지 생성 기능 추가후 1주일동안 만들어진 이미지가 7억장이라고 밝혔다.#

이미지 생성 기능으로 만든 결과물에는 ChatGPT 도구에서 생성된 이미지임을 알 수 있는 C2PA 메타데이터가 포함된다. 이는 Content Credentials를 통해 검증할 수 있다.[3]

프롬프트로 매우 자세하기 조정하지 않는 한 생성된 이미지들에 강한 따뜻한 색조가 입혀진다. 심할 경우에는 오줌 필터라며 비난 받는 경우도 있다. 같은 이미지를 반복해서 재생성 해 달라고 요청할 경우 거의 진한 갈색까지 왜곡된다.

2.2. GPT-image-1.5

2025년 12월 17일, 새로운 ChatGPT 이미지(GPT-Image-1.5)가 출시되었다. [4]

기존의 이미지1에 비해 상당한 성능의 향상이 있었지만 나노바나나 프로에 비해 이미지 유지력이나 디테일 부분에서 부족한 부분이 많다는 평을 받는다. 나노바나나1보단 우수하지만 여전히 이미지 부분에서 구글과의 격차를 줄이기에는 부족하다는 평이다. 다만 이번 1.5 모델 또한 4o 기반의 모델이라 차후 출시될 2.0 이상 이미지 모델은 성능 향상을 기대해 볼 법 하다.

3. ChatGPT 지브리풍 이미지 생성 유행

샘 알트만 오픈AI 최고경영자가 X에 자신의 사진을 지브리풍으로 바꾼 사진을 바꾸며 시작된 유행. 자세한 내용은 항목 참조.


[1] 기존 이미지 생성의 프롬프트 나열 조합식이 아닌, 자연어로 요청해도 술술 나온다. NAI 이미지 제네레이터에도 V4에서 자연어를 인식할 수 있게 되었지만, 그것과는 차원이 다른 자연어 인식 수준을 보여준다.[2] 기존에는 자사 모델이었던 DALL-E에게 요청한 뒤 그 결과를 보여주었으며 자체 이미지 생성 기능은 없었다. 업데이트 이후로 기존 DALL·E는 별도의 GPTs에서 선택하여 사용하는 방식으로 변경되었다.[3] 그러나 이렇게 생성된 이미지를 다시 ChatGPT에 업로드하더라도, 모델이 이런 데이터를 자동으로 읽어들이는 기능을 지원되지 않으므로 ChatGPT 내에서 AI 생성 여부를 명확히 확인하는 것은 불가능하다. 또한 이미지가 스크린샷되거나 SNS에 업로드되는 과정에서 메타데이터가 삭제되면 외부 사이트를 통한 확인도 불가능하다.[4] 기존의 4o 이미지 생성은 일반적인 방법으로 더 이상 이할 수 없다. 대신, API와 별도의 GPTs를 통해서만 이용할 수 있다.