OpenAI가 새로운 플래그십 이미지 생성 모델을 기반으로 한 ChatGPT 이미지를 내놨다고 17일 밝혔다.
새로운 이미지를 만들거나 기존 사진을 편집할 때 사용자가 생각하는 결과에 더 가까운 결과물을 얻을 수 있게 된 것으로, 중요한 디테일은 그대로 유지하면서 정밀한 편집이 가능해 졌고, 이미지 생성속도는 최대 4배 더 빨라졌다는게 OpenAI의 설명이다.
새로운 이미지 전용 모델과 기능은 이날부터 모든 ChatGPT 사용자에게 순차적으로 제공되며, API에서는 GPT 이미지 1.5로 이용할 수 있게 된다.
OpenAI에 따르면, ChatGPT에 이미지를 업로드해 편집을 요청하면 조명, 구도, 인물의 외형과 같은 핵심 요소는 그대로 유지하면서 사용자가 요청한 부분만 정확히 변경할 수 있다. 이에 따라 실용적인 사진 편집, 현실감 있는 의상 및 헤어스타일 시뮬레이션, 원본의 이미지는 유지하는 스타일 필터 적용이 가능하다.
이러한 개선을 통해 ChatGPT는 실용적인 편집과 표현력 있는 재해석을 모두 수행할 수 있는 '주머니 속 크리에이티브 스튜디오'로 작동하게 된다고 OpenAI는 설명했다.
ChatGPT 이미지는 텍스트와 레이아웃 등 요소를 변경하거나 추가해 아이디어를 생동감 있게 구현하는 변환 기능에서 '창의적 변환(Creative Transformations)'을 경험할 수 있다. 중요한 디테일은 유지하면서도 표현을 확장할 수 있으며, 이러한 변환은 단순한 콘셉트부터 보다 정교한 아이디어까지 모두 적용 가능하다.
또한 새로운 ChatGPT 이미지 기능에서 제공되는 사전 설정된 스타일과 아이디어를 활용하면, 별도의 텍스트 프롬프트 없이도 손쉽게 시도할 수 있다는게 OpenAI의 설명이다.
또한 ChatGPT 이미지는 초기 버전보다 사용자의 지시를 더욱 안정적으로 수행한다. 이에 따라, 보다 정교한 편집이 가능해졌으며 요소 간의 관계가 의도한 대로 유지되는 더욱 복잡하고 세밀한 원본 구성도 구현할 수 있다. 여기에 텍스트 렌더링에서 한 단계 더 발전해, 더 촘촘하고 작은 텍스트도 처리할 수 있다.
ChatGPT 이미지는 더 빠른 이미지 생성, 정밀한 편집, 그리고 반복 작업 전반에 걸친 일관된 시각적 디테일 유지를 통해 비즈니스 워크플로우를 효율화할 수 있다. 아이디어를 탐색하고, 필요한 부분만 정확히 수정하며, 복잡하거나 다소 건조한 개념도 시각적으로 구현할 수 있다. 이를 통해 마케팅, 디자인, 이커머스, 내부 커뮤니케이션 등 다양한 업무 활용 사례를 지원한다.
API의 GPT 이미지 1.5는 ChatGPT 이미지에서 제공되는 모든 개선 사항을 그대로 제공한다. 또한 GPT 이미지 1.5는 GPT 이미지 1 대비 이미지 입력·출력 비용이 20% 더 저렴해, 동일한 예산으로 더 많은 이미지를 생성하고 반복 작업할 수 있다.
OpenAI 관계자는 "GPT 이미지 1 대비 이미지를 유지하고 편집하는 기능이 더욱 강화됐고, 편집을 거쳐도 브랜드 로고와 핵심 비주얼을 더 일관되게 유지할 수 있어 그래픽·로고 제작과 같은 마케팅·브랜딩 작업, 그리고 단일 소스 이미지로부터 다양한 제품 이미지 카탈로그를 생성해야 하는 이커머스 팀에 특히 적합하다"라고 전했다. [파이낸셜신문=황병우 기자]

