Nếu bạn đang tích hợp tạo ảnh vào sản phẩm, câu hỏi thực tế thường là: có thể yêu cầu kích thước nào, tỷ lệ khung hình nào được chấp nhận, và tỷ lệ nào cho kết quả tốt nhất? Với bộ nguồn hiện có, câu trả lời phải thận trọng hơn: ma trận kích thước và tỷ lệ của GPT Image 2 chưa được xác minh trong các đoạn trích này. Trước khi thiết kế luồng sản phẩm hay viết code cố định, hãy đối chiếu tài liệu OpenAI hiện hành hoặc thử trực tiếp trên tài khoản của bạn.[1][
13]
Câu trả lời đã xác minh
Hiện chưa đủ bằng chứng trong các nguồn được cung cấp để công bố một bảng kích thước ảnh GPT Image 2 mang tính chắc chắn.
Hai nguồn mạnh nhất là trang mô hình GPT Image 2 và hướng dẫn Images and Vision của OpenAI.[1][
13] Tuy nhiên, các đoạn trích đi kèm không liệt kê kích thước pixel chính xác, các giá trị tỷ lệ khung hình được chấp nhận, hoặc khuyến nghị rằng một tỷ lệ nào đó cho chất lượng tốt hơn.[
1][
13]
Điểm này quan trọng: nó không chứng minh rằng GPT Image 2 không có tùy chọn cố định. Nó chỉ có nghĩa là bằng chứng trong tay chưa xác minh được các tùy chọn đó.
Nguồn nào nói được gì?
| Nguồn | Có thể dùng để khẳng định | Chưa chứng minh được từ đoạn trích |
|---|---|---|
| Trang GPT Image 2 trong tài liệu OpenAI | OpenAI có trang mô hình GPT Image 2 trong tài liệu API.[ | Danh sách kích thước được hỗ trợ, ma trận tỷ lệ khung hình, hoặc tỷ lệ nên dùng nhất.[ |
| Hướng dẫn Images and Vision của OpenAI | OpenAI có hướng dẫn Images and Vision trong bộ tài liệu API.[ | Kích thước đầu ra chính xác của GPT Image 2 hoặc xếp hạng chất lượng theo tỷ lệ ảnh.[ |
| Đoạn trích Threads | Có nhắc các nhãn Square 1:1, Landscape 5:4, Story 9:16 và Ultra Wide 21:9.[ | Rằng các nhãn đó là tham số API chính thức, đầy đủ, hoặc có sẵn cho mọi người dùng GPT Image 2.[ |
| Đoạn trích Reddit | Một người dùng nói model hỗ trợ một tập kích thước và tỷ lệ cố định, đồng thời gợi ý xem trang API.[ | Các giá trị cụ thể trong tập cố định đó.[ |
| Đoạn trích YouTube | Một video nói có bàn về tỷ lệ khung hình và độ phân giải cho ChatGPT Images 2.0.[ | Ma trận kích thước GPT Image 2 chính xác hoặc các giá trị API được chấp nhận.[ |
| Tài liệu tạo video với Sora | OpenAI đưa ví dụ yêu cầu Sora video với model sora-2-pro, endpoint /v1/videos, size là 1280x720 và seconds là 8.[ | Rằng 1280x720 là kích thước tạo ảnh được GPT Image 2 chấp nhận.[ |
Vì sao ảnh chụp màn hình trên mạng chưa đủ để viết code
Đoạn trích Threads hữu ích như một manh mối vì nó nêu các nhãn tỷ lệ cụ thể: Square 1:1, Landscape 5:4, Story 9:16 và Ultra Wide 21:9.[10] Nhưng một bài đăng xã hội hoặc ảnh chụp màn hình không phải là đặc tả API.
Khi đưa vào sản xuất, đội kỹ thuật cần nhiều hơn một nhãn hiển thị. Bạn cần biết tên tham số chính xác, toàn bộ tập giá trị được chấp nhận, các giá trị đó áp dụng cho API hay chỉ cho giao diện người dùng, ảnh trả về có kích thước pixel nào, và quyền truy cập có khác nhau theo tài khoản hay bề mặt sử dụng hay không. Các đoạn trích xã hội được cung cấp không trả lời được những điểm này.[10][
11][
12]
Đoạn trích Reddit cũng chỉ mang tính định hướng: nó nói GPT Image 2 hỗ trợ một tập kích thước và tỷ lệ cố định, nhưng không liệt kê tập đó.[11] Vì vậy, đây là lý do để kiểm tra tài liệu API, không phải là nguồn đủ để dựng bảng tương thích.
Đừng nhầm ví dụ Sora với kích thước ảnh GPT Image 2
Con số cụ thể nhất trong các trích đoạn OpenAI là 1280x720, nhưng nó xuất hiện trong hướng dẫn tạo video với Sora.[14] Ví dụ đó dùng endpoint
/v1/videos, model sora-2-pro, trường size là 1280x720 và tham số tạo video 8 giây.[14]
Điều này hỗ trợ một kết luận về yêu cầu tạo video Sora. Nó không xác minh rằng 1280x720 được GPT Image 2 chấp nhận cho tạo ảnh.[14]
Cách xử lý an toàn khi tích hợp GPT Image 2
Cho đến khi bạn có bảng chính thức hiện hành hoặc hành vi đã được kiểm chứng trong tài khoản của mình, đừng hard-code kích thước GPT Image 2 chỉ từ bài đăng xã hội, ảnh chụp màn hình hoặc tài liệu của model khác.
Một quy trình thận trọng hơn:
- Bắt đầu từ trang mô hình GPT Image 2 và hướng dẫn Images and Vision của OpenAI.[
1][
13]
- Xác nhận các giá trị tham số được chấp nhận cho đúng model và đúng endpoint bạn đang gọi.[
1][
13]
- Thử từng kích thước hoặc tỷ lệ một, thay vì mặc định rằng nhãn trong giao diện sẽ khớp trực tiếp với giá trị API.
- Ghi lại cả giá trị đã yêu cầu và kích thước ảnh thực tế được trả về, vì câu chữ trong prompt không đồng nghĩa với tham số API được tài liệu hóa.
- Xem các nhận định như “ảnh vuông cho kết quả tốt nhất” hoặc “ảnh dọc cho kết quả tốt nhất” là chưa được xác minh, trừ khi chúng đến từ hướng dẫn chính thức hoặc thử nghiệm có kiểm soát; các trích đoạn chính thức ở đây không xếp hạng chất lượng theo tỷ lệ ảnh.[
1][
13]
Có thể nói gì ngay lúc này?
Bạn có thể nói rằng bộ nguồn này có các trang tài liệu OpenAI cho GPT Image 2 và Images and Vision.[1][
13] Bạn cũng có thể nói rằng các đoạn trích hiện có không xác minh kích thước pixel chính xác, tỷ lệ khung hình được hỗ trợ, hoặc tỷ lệ cho hiệu năng/chất lượng tốt nhất của GPT Image 2.[
1][
13]
Ngược lại, không nên trình bày các nhãn trên mạng xã hội như giá trị API đã được xác nhận. Cũng không nên lấy kích thước video Sora để làm yêu cầu tạo ảnh GPT Image 2 nếu chưa có bằng chứng riêng.[10][
14]
Tóm lại
Đừng xuất bản hoặc xây tính năng dựa trên một bảng kích thước GPT Image 2 “chắc chắn đúng” nếu chỉ có các bằng chứng này. Các nguồn chính thức trong bộ trích dẫn chỉ ra nơi cần kiểm tra, nhưng các đoạn trích được cung cấp không nêu giá trị cụ thể. Cho đến khi kích thước và tỷ lệ được xác nhận trong tài liệu OpenAI hiện hành hoặc bằng thử nghiệm trực tiếp, kích thước ảnh GPT Image 2 chính xác và tỷ lệ “tốt nhất” vẫn là thông tin chưa được xác minh.[1][
13]




