Bản cập nhật ChatGPT mới nhất của OpenAI đánh dấu một bước tiến đáng kể, mang đến khả năng tạo ảnh được nâng cấp mạnh mẽ với mô hình GPT-4o. Giờ đây, thay vì phải chuyển sang DALL-E 3, người dùng có thể tạo ra những hình ảnh chất lượng cực cao trực tiếp bằng GPT-4o mà không cần bắt đầu một cuộc trò chuyện mới. Tuy nhiên, có một hạn chế nhỏ đối với người dùng ChatGPT miễn phí – ít nhất là ở thời điểm hiện tại.
Nâng Cấp Đáng Kể Khả Năng Tạo Ảnh Của ChatGPT
Mô hình GPT-4o của OpenAI là lựa chọn mặc định cho hầu hết các cuộc trò chuyện trên ChatGPT, được OpenAI đánh giá là “Tuyệt vời cho hầu hết các câu hỏi.” Mô hình này thực sự hiệu quả, xử lý một loạt thông tin rộng lớn với tốc độ và độ chính xác cao, nhưng trước đây chỉ giới hạn ở văn bản.
Sau bản cập nhật vào ngày 25 tháng 3 năm 2025, GPT-4o đã có thể tạo ra những hình ảnh chất lượng cao với chi tiết đáng kinh ngạc, vượt trội so với mô hình mà nó gần như thay thế là DALL-E 3. Hơn nữa, GPT-4o giờ đây có thể thực hiện các tác vụ chỉnh sửa và điều chỉnh hình ảnh vượt xa khả năng của DALL-E 3. Các chức năng như chỉnh sửa ảnh, điều chỉnh màu sắc và phong cách, thay đổi tinh tế, thêm hoặc bớt đối tượng tiền cảnh và hậu cảnh, và nhiều khả năng khác đều đã trở nên khả thi.
Khả năng tạo văn bản trong hình ảnh cũng được cải thiện một cách đáng ngạc nhiên. Khả năng tạo văn bản của DALL-E 3 chưa bao giờ là điểm mạnh (dù đây cũng không phải là điểm mạnh của hầu hết các mô hình AI khác). Giờ đây, GPT-4o có thể tạo ra các infographic chi tiết với phần giải thích minh họa rõ ràng về hầu hết mọi chủ đề. Vị trí văn bản trong hình ảnh giờ đây rất chính xác, sử dụng các kiểu và hướng văn bản cụ thể mà không lo tạo ra các hình ảnh AI bị mờ nhòe. Khả năng giữ chi tiết cũng là một cải tiến rõ rệt khác, với các đặc điểm cụ thể dễ dàng được truyền từ hình ảnh này sang hình ảnh khác mà không khiến ChatGPT thay đổi hoàn toàn cảnh hoặc tạo ra một hình ảnh hoàn toàn mới.
Thợ săn quái vật giả tưởng đang mua sắm tại siêu thị, minh họa chất lượng ảnh DALL-E 3
Hình ảnh thợ săn quái vật giả tưởng tại siêu thị được tạo bởi GPT-4o với độ chi tiết nâng cao
Người đàn ông giống Einstein ăn kem tại Central Park, minh họa khả năng tạo ảnh của DALL-E 3
Hình ảnh người giống Einstein ăn kem ở Central Park được tạo bởi GPT-4o, thể hiện sự cải thiện chi tiết
Một phần của chất lượng hình ảnh được nâng cấp đến từ sự hợp tác của OpenAI với các công ty như Shutterstock và một nhóm các chuyên gia đã dành nhiều giờ để chỉ ra các lỗi mà GPT-4o mắc phải trong quá trình tạo ảnh. Chia sẻ với Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường (reinforcement learning) này cho phép GPT-4o tuân thủ chính xác các hướng dẫn của con người trên một phạm vi rộng lớn các yêu cầu tạo ảnh, và quá trình này chỉ cần “hơn 100 nhân công” để hoàn thành. Khả năng tạo ảnh mới của ChatGPT thực sự đáng kinh ngạc và thuthuat365.net khuyến nghị bạn nên thử nghiệm nó với bất kỳ chủ đề nào bạn mong muốn. Mặc dù vẫn chưa hoàn hảo—không có công cụ tạo ảnh AI nào hoàn hảo—nhưng đây là một bước nhảy vọt đáng kể về chất lượng so với các mô hình tạo ảnh AI trước đây như DALL-E 3, vốn hữu ích nhưng chưa thực sự ấn tượng.
Cập Nhật Ảnh Tuyệt Vời Của ChatGPT Đang Dần Đến Tay Mọi Người
Đáng tiếc, do nhu cầu sử dụng GPT-4o chưa từng có tiền lệ, người dùng ChatGPT miễn phí một lần nữa buộc phải chờ đợi tính năng mới này. Vào ngày 26 tháng 3 năm 2025, CEO của OpenAI, Sam Altman, đã xác nhận sự chậm trễ này mà không đưa ra thời gian cụ thể cho việc kết thúc.
Sự gia tăng về mức độ quan tâm đã được dự kiến, nhưng không đến mức quá lớn như vậy. Điều này đồng nghĩa với việc bạn sẽ phải chờ đợi thêm một thời gian hoặc nâng cấp lên gói ChatGPT Plus với mức phí 20 đô la mỗi tháng. Công bằng mà nói, với những bản nâng cấp đột phá như thế này, việc nâng cấp lên ChatGPT Plus trở nên đáng giá hơn nhiều, thậm chí còn hơn cả thời điểm ra mắt bản nâng cấp mô hình trước đó của OpenAI, GPT-4.5.
Cũng cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo ảnh kế thừa” của OpenAI. Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại vẫn chưa có lộ trình cụ thể cho sự thay đổi này.
Với những cải tiến mạnh mẽ trong khả năng tạo và chỉnh sửa ảnh, GPT-4o đang định hình lại cách chúng ta tương tác với AI để tạo ra nội dung trực quan. Bản cập nhật này không chỉ nâng cao chất lượng đầu ra mà còn mở rộng đáng kể phạm vi ứng dụng của ChatGPT trong các lĩnh vực sáng tạo, từ thiết kế đồ họa đơn giản đến việc tạo ra các minh họa phức tạp. Hãy trải nghiệm và khám phá tiềm năng vô hạn của GPT-4o ngay hôm nay!