최근 ChatGPT 4o 에서 이미지 생성 기능이 대폭 향상되어 많은 분들의 관심을 받고 있습니다.
특히 지브리 스타일로 여러 사진들을 만들면서 GPU가 녹아내린다는 표현까지 나왔죠.

오늘은 openAI 사에서 소개자료로 만든 예제들을 바탕으로 새로운 기능을 소개하도록 하겠습니다.

아래 예제 프롬프트를 ChatGPT 프롬프트에 넣으면 다음과 같은 이미지가 생성됩니다. 제가 실제로 해본거라 openAI에 첨부된 이미지랑은 약간 차이가 있지만 정말 디테일하게 잘 만들어주는걸 알 수 있습니다.
A wide image taken with a phone of a glass whiteboard, in a room overlooking the Bay Bridge. The field of view shows a woman writing, sporting a tshirt wiith a large OpenAI logo. The handwriting looks natural and a bit messy, and we see the photographer's reflection.
The text reads:
(left)
"Transfer between Modalities:
Suppose we directly model
p(text, pixels, sound) [equation]
with one big autoregressive transformer.
Pros:
* image generation augmented with vast world knowledge
* next-level text rendering
* native in-context learning
* unified post-training stack
Cons:
* varying bit-rate across modalities
* compute not adaptive"
(Right)
"Fixes:
* model compressed representations
* compose autoregressive prior with a powerful decoder"
On the bottom right of the board, she draws a diagram:
"tokens -> [transformer] -> [diffusion] -> pixels"

selfie view of the photographer, as she turns around to high five him

아래와 같이 변환이 됩니다.

위와 같이 최신 이미지 생성 기술은 텍스트를 정확하게 렌더링하고, 프롬프트를 정밀하게 따르며, 고유한 지식 기반과 대화 맥락을 활용하는 능력에서 두각을 나타냅니다. 여기에는 업로드된 이미지를 변형하거나 시각적 영감으로 활용하는 능력도 포함됩니다. 이러한 기능들은 사용자가 정확히 원하는 이미지를 만들기 쉽게 함으로써, 시각적 소통을 더 효과적으로 할 수 있게 도와줍니다.
이미지 생성 기술의 진정한 혁신은 단순히 아름다운 그림을 만드는 것이 아닌, 정밀함과 의도된 목적에 부합하는 실용적 도구로 발전하는 데 있습니다. 이를 통해 이미지 생성은 예술적 취미를 넘어, 비즈니스, 교육, 연구 등 다양한 분야에서 실질적인 가치를 창출할 수 있는 도구로 자리매김하고 있습니다.
앞으로 이미지 생성 기술이 더욱 정교해지면서, 우리는 텍스트와 이미지의 경계가 더욱 희미해지는 새로운 시각적 커뮤니케이션의 시대를 맞이하게 될 것입니다. 정보 전달의 정확성과 효율성을 높이는 이러한 도구들은 우리의 소통 방식을 근본적으로 변화시킬 잠재력을 가지고 있습니다.
한번 도전해보실래요? ㅎ

'기타' 카테고리의 다른 글
Maskara.AI: 프롬프트 생성의 혁신을 이끄는 플랫폼 (0) | 2025.04.08 |
---|---|
ChatGPT 4o 이미지 생성 기능 업데이트 - Part2 텍스트 기능 (0) | 2025.04.08 |
수유역 고시원 고시텔, 개인 욕실 완비한 스테이에이치 🚿✨ (1) | 2025.04.01 |
헌법재판소 한덕수 총리 탄핵안 기각, 재판관 의견 분석과 정치적 함의 (0) | 2025.03.24 |
동탄소호사무실, 동탄비상주사무실 바로 여기에서 (0) | 2025.03.23 |