Bản cập nhật ChatGPT mới nhất của OpenAI đã mang đến một nâng cấp vượt bậc cho khả năng tạo hình ảnh của GPT-4o. Giờ đây, thay vì phải chuyển đổi sang DALL-E 3, người dùng có thể tạo ra những hình ảnh chất lượng cực cao trực tiếp bằng GPT-4o mà không cần bắt đầu một cuộc trò chuyện mới. Đây là một bước tiến đáng kể, định hình lại cách chúng ta tương tác với các công cụ AI trong lĩnh vực nghệ thuật và thiết kế số. Tuy nhiên, một lưu ý quan trọng là tính năng này hiện tại chưa hoàn toàn khả dụng cho tất cả người dùng miễn phí của ChatGPT.
GPT-4o Đẩy Mạnh Khả Năng Tạo Và Chỉnh Sửa Hình Ảnh
Mô hình GPT-4o của OpenAI đã trở thành lựa chọn mặc định cho hầu hết các cuộc hội thoại trên ChatGPT, được đánh giá là “Tuyệt vời cho hầu hết các câu hỏi” nhờ khả năng xử lý nhanh chóng và chính xác nhiều loại thông tin—nhưng trước đây chỉ giới hạn ở văn bản.
Sau bản cập nhật vào ngày 25 tháng 3 năm 2025, GPT-4o đã có khả năng tạo ra những hình ảnh chất lượng cao với độ chi tiết đáng kinh ngạc, vượt trội hơn hẳn mô hình mà nó đang dần thay thế là DALL-E 3. Không chỉ dừng lại ở việc tạo hình ảnh, GPT-4o giờ đây còn có thể thực hiện các tác vụ chỉnh sửa và điều chỉnh hình ảnh vượt xa khả năng của DALL-E 3. Các tính năng như chỉnh sửa ảnh, điều chỉnh màu sắc và phong cách, thay đổi tinh tế các chi tiết, thêm hoặc bớt đối tượng tiền cảnh và hậu cảnh đều trở nên khả thi.
Người thợ săn quái vật giả tưởng với sẹo trên mặt đang mua sắm tại siêu thị hiện đại, tạo bởi DALL-E 3
Phiên bản người thợ săn quái vật giả tưởng được tạo bởi GPT-4o, thể hiện chi tiết và độ chân thực vượt trội
Hình ảnh người đàn ông giống Einstein ăn kem tại Central Park, được tạo ra từ DALL-E 3
Phiên bản GPT-4o của hình ảnh Einstein ăn kem tại Central Park, cho thấy sự cải tiến về chi tiết
Cải Tiến Vượt Bậc Về Văn Bản Trong Hình Ảnh Và Chi Tiết
Khả năng tạo văn bản trong hình ảnh cũng được cải thiện đáng kinh ngạc. Trong khi việc tạo văn bản của DALL-E 3 chưa bao giờ là điểm mạnh (điều này phổ biến ở hầu hết các mô hình AI), thì GPT-4o giờ đây có thể tạo ra các infographic chi tiết với phần giải thích rõ ràng về hầu hết mọi chủ đề. Vị trí văn bản trong hình ảnh giờ đây chính xác, sử dụng các kiểu chữ và hướng cụ thể mà không lo tạo ra các lỗi “AI slop” mờ nhòe. Khả năng duy trì chi tiết cũng là một cải tiến rõ rệt khác, với các đặc điểm cụ thể dễ dàng được chuyển từ hình ảnh này sang hình ảnh khác mà không khiến ChatGPT thay đổi hoàn toàn cảnh hoặc tạo ra một hình ảnh mới.
Một phần của việc nâng cấp chất lượng hình ảnh này đến từ quan hệ đối tác của OpenAI với các công ty như Shutterstock và một nhóm các chuyên gia huấn luyện đã dành nhiều giờ để chỉ ra các lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trao đổi với Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường này cho phép GPT-4o tuân thủ chính xác các hướng dẫn của con người trên một phạm vi rộng lớn các yêu cầu tạo hình ảnh, và quá trình này chỉ cần “hơn 100 nhân viên con người” để hoàn thành. Khả năng tạo hình ảnh mới của ChatGPT thực sự ấn tượng, và thuthuat365.net khuyến khích bạn đọc trải nghiệm tính năng này với bất kỳ chủ đề nào bạn muốn. Mặc dù chưa hoàn hảo—như bất kỳ công cụ tạo ảnh AI nào khác—nhưng đây là một bước nhảy vọt đáng chú ý về chất lượng từ các mô hình như DALL-E 3.
Lưu Ý Quan Trọng Với Người Dùng Miễn Phí Và Tương Lai Của DALL-E 3
Đáng tiếc, do nhu cầu sử dụng GPT-4o tăng đột biến, người dùng miễn phí của ChatGPT một lần nữa phải chờ đợi tính năng mới này. Vào ngày 26 tháng 3 năm 2025, CEO OpenAI Sam Altman đã xác nhận sự chậm trễ nhưng không đưa ra khoảng thời gian cụ thể.
Sự gia tăng đột biến về lượt quan tâm đã được dự đoán, nhưng mức độ thì vượt ngoài mong đợi. Điều này có nghĩa là người dùng sẽ phải chờ thêm một thời gian hoặc nâng cấp lên ChatGPT Plus với 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp như thế này, việc nâng cấp lên ChatGPT Plus trở nên đáng giá hơn nhiều so với việc ra mắt mô hình trước đây của OpenAI.
Cũng cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo ảnh kế thừa của OpenAI”. Điều này ngụ ý rằng OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện chưa có mốc thời gian cụ thể cho sự thay đổi này.
Kết luận, bản cập nhật GPT-4o về khả năng tạo và chỉnh sửa hình ảnh là một bước tiến vượt bậc, khẳng định vị thế dẫn đầu của OpenAI trong lĩnh vực AI sáng tạo. Dù vẫn còn những hạn chế ban đầu về khả năng tiếp cận, nhưng tiềm năng của GPT-4o trong việc biến ý tưởng thành hình ảnh trực quan chất lượng cao là vô cùng lớn, mở ra kỷ nguyên mới cho người dùng và các nhà sáng tạo nội dung. Bạn đã sẵn sàng khám phá sức mạnh của GPT-4o chưa? Hãy chia sẻ trải nghiệm của bạn dưới phần bình luận!