Nếu đang xây tính năng tạo hoặc chỉnh sửa ảnh với GPT Image 2, điều cần kiểm tra không chỉ là có thấy một ví dụ 1024x1024 hay không. Câu hỏi quan trọng hơn là: đó có phải danh sách kích thước được OpenAI xác nhận cho GPT Image 2 hay chỉ là một ví dụ trong tài liệu API?
Kết luận thận trọng: OpenAI có trang model GPT Image 2 trong tài liệu API [1], Images API có trường
size cho ảnh được tạo [18], và ví dụ
Create image editsize: "1024x1024"14]. Nhưng các nguồn được cung cấp chưa đủ để chốt một bảng kích thước hợp lệ đầy đủ hoặc toàn bộ ràng buộc ảnh đầu vào riêng cho GPT Image 2.
Những gì có thể xác nhận
| Vấn đề | Kết luận an toàn | Nguồn |
|---|---|---|
| GPT Image 2 có trong tài liệu OpenAI API không? | Có. OpenAI có trang model mang tiêu đề GPT Image 2 trong tài liệu API. | [ |
| OpenAI Images API có tạo ảnh và chỉnh sửa ảnh không? | Có. API reference có mục | [ |
| API có trường kích thước ảnh không? | Có. Tài liệu Images mô tả size là kích thước của ảnh được tạo, cùng các trường như background, output_format và quality. | [ |
Có thể xác nhận 1024x1024 không? | Có, nhưng chỉ như một giá trị xuất hiện trong ví dụ phản hồi image edit được trích dẫn. | [ |
| Có thể liệt kê toàn bộ kích thước GPT Image 2 hỗ trợ không? | Chưa đủ bằng chứng trong các nguồn được cung cấp để liệt kê đầy đủ. | [ |
| Có thể xác nhận giới hạn ảnh đầu vào không? | Chưa đủ bằng chứng trong các nguồn được cung cấp để kết luận về định dạng file, dung lượng tối đa, độ phân giải tối đa hoặc số ảnh đầu vào mỗi request. | [ |
Kích thước đầu ra: có trường size, nhưng chưa có danh sách đầy đủ
Tài liệu Images của OpenAI mô tả size là kích thước của ảnh được tạo [18]. Cùng nhóm tài liệu này cũng nhắc đến các trường như
background, output_format, quality và thông tin token usage dành cho GPT image models [18].
Bằng chứng cụ thể nhất về một kích thước là ví dụ phản hồi trong Create image editoutput_format: "png"quality: "low"size: "1024x1024"14].
Điều này chưa đủ để kết luận rằng GPT Image 2 chỉ hỗ trợ 1024x1024, hoặc rằng model hỗ trợ một danh sách cụ thể như ảnh vuông, ngang, dọc hay 4K. Cách diễn đạt chính xác hơn là: OpenAI Images API có trường size; ví dụ image edit trong tài liệu hiển thị 1024x1024; các nguồn được trích dẫn chưa cho thấy danh sách đầy đủ các giá trị size hợp lệ riêng cho GPT Image 2 [14][
18].
Vì vậy, khi viết tài liệu kỹ thuật hoặc thiết kế schema sản phẩm, không nên biến một giá trị ví dụ trong API reference thành ma trận hỗ trợ chính thức.
Ảnh đầu vào và image edit: có workflow, nhưng thiếu thông số giới hạn
OpenAI có tham chiếu API cho thao tác chỉnh sửa ảnh qua Create image edit14][
15]. OpenAI Cookbook cũng mô tả workflow dùng mask khi chỉnh sửa ảnh: người dùng có thể cung cấp mask nếu không muốn model thay đổi một phần của ảnh đầu vào [
21].
Điểm cần lưu ý là mask không phải cơ chế bảo toàn tuyệt đối. Cookbook cảnh báo model vẫn có thể chỉnh sửa một số phần bên trong vùng mask, dù sẽ cố tránh; nếu cần mask chính xác, tài liệu gợi ý dùng mô hình segmentation [21].
Từ các nguồn hiện có, có thể xác nhận ba điểm:
- OpenAI Images API có tham chiếu cho chỉnh sửa ảnh [
14][
15].
- Có workflow dùng mask trong image edit [
21].
- Mask không nên được xem là bảo đảm pixel-perfect cho vùng cần giữ nguyên [
21].
Ngược lại, các nguồn được cung cấp chưa đủ để xác nhận đầy đủ các thông số như định dạng ảnh đầu vào được chấp nhận, dung lượng file tối đa, độ phân giải ảnh đầu vào tối đa, số lượng ảnh đầu vào mỗi request, hoặc yêu cầu alpha channel riêng cho GPT Image 2 [14][
15][
21].
Đừng trộn thông số OpenAI với schema của provider bên thứ ba
Một số provider bên thứ ba có trang riêng cho GPT Image 2. Runware mô tả GPT Image 2 là model thuộc GPT Image family dùng cho text-to-image generation và image editing [3]. Fal.ai cũng có trang GPT Image 2.0 với playground, API và schema riêng [
6].
Những trang này hữu ích nếu bạn gọi GPT Image 2 qua hạ tầng của chính provider đó. Nhưng nếu gọi OpenAI trực tiếp, nên tách rõ hai lớp thông tin: tài liệu OpenAI API và schema của provider trung gian. Một enum kích thước hoặc giới hạn file trong schema của provider không tự động trở thành thông số chính thức của OpenAI API [3][
6].
Checklist triển khai an toàn
- Không hard-code danh sách kích thước chỉ dựa trên
1024x1024. Giá trị này xuất hiện trong ví dụ image edit, nhưng nguồn được trích dẫn không cho thấy đó là danh sách kích thước đầy đủ cho GPT Image 2 [14].
- Kiểm tra lại tài liệu OpenAI trước khi phát hành. Trang model GPT Image 2 và OpenAI Images API là các điểm kiểm chứng phù hợp khi gọi OpenAI trực tiếp [
1][
18].
- QA kỹ nếu dùng mask. OpenAI cảnh báo model vẫn có thể chỉnh một phần trong vùng mask, nên không nên dựa vào mask như bảo đảm tuyệt đối [
21].
- Tách cấu hình theo provider. Nếu dùng Runware hoặc Fal.ai, hãy theo schema của provider đó; nếu dùng OpenAI trực tiếp, hãy theo tài liệu OpenAI [
3][
6].
Kết luận
Câu trả lời ngắn gọn là: GPT Image 2 có trong tài liệu OpenAI API [1]; OpenAI Images API có trường
size cho ảnh được tạo [18]; ví dụ
Create image edit1024x1024 [14]. Tuy nhiên, với các nguồn được cung cấp, chưa thể công bố một danh sách kích thước ảnh đầy đủ hoặc bộ ràng buộc ảnh đầu vào chính thức riêng cho GPT Image 2.




