Trong những năm gần đây, các công cụ AI tạo sinh hình ảnh đã trở nên quen thuộc, từ OpenAI, Imagen, Adobe Firefly cho đến DALL-E 3, liên tục mang đến nhiều lựa chọn để tinh chỉnh kết quả. Khi công nghệ này phát triển, chúng ta dường như có ngày càng nhiều phương án để nâng cao chất lượng đầu ra. Mới đây, Google Labs đã giới thiệu Whisk, một công cụ đột phá cho phép người dùng tải lên hình ảnh làm nguồn tham chiếu thay vì chỉ dựa vào các câu lệnh văn bản truyền thống.
Whisk: Công Cụ AI Đột Phá Từ Google Labs Tạo Ảnh Từ Nguồn Tham Chiếu Hình Ảnh
Hiện tại, người dùng tại Mỹ đã có thể trải nghiệm Whisk, một “thử nghiệm trong lĩnh vực AI tạo sinh” theo công bố của Google Labs trên blog chính thức của họ. Với Whisk, thay vì chỉ phụ thuộc vào các mô tả văn bản, bạn có thể thêm hình ảnh làm nguồn tham chiếu. Nền tảng này sẽ yêu cầu ba đặc điểm chính: chủ thể (subject), khung cảnh (scene), và phong cách (style). Whisk sẽ kết hợp, hay “nhào trộn” (whisk) các “thành phần” này lại với nhau để tạo ra hình ảnh hoàn hảo cho bạn.
Whisk sử dụng Imagen 3, mô hình tạo sinh hình ảnh mới nhất của Google, mang lại khả năng xử lý và tạo hình ảnh tiên tiến.
Google không loại bỏ hoàn toàn khả năng sử dụng prompt văn bản trong Whisk. Người dùng vẫn có tùy chọn viết các câu lệnh riêng cho từng danh mục (chủ thể, khung cảnh, phong cách) hoặc thêm một ghi chú chung. Hơn nữa, bạn có thể tinh chỉnh hình ảnh sau khi Whisk tạo ra phiên bản đầu tiên. Chẳng hạn, nếu bạn tạo một tấm thiệp Giáng sinh cổ điển với hình ảnh một chú mèo nằm trong tuyết, sau khi xem kết quả, bạn có thể được truyền cảm hứng để thêm những bông tuyết như một chi tiết cuối cùng.
Mỗi khi bạn thêm hoặc tạo một hình ảnh trong bất kỳ ba danh mục nào của Whisk, nền tảng sẽ tự động thực hiện việc tạo ra một mô tả văn bản chi tiết về hình ảnh đó. Điều này có nghĩa là nếu bạn muốn bổ sung hoặc chỉnh sửa một hình ảnh hiện có, bạn chỉ cần tùy chỉnh phần văn bản mô tả này.
Giao diện Google Whisk hiển thị hộp thoại cho phép chỉnh sửa prompt văn bản AI được tạo tự động từ hình ảnh tham chiếu
Ngoài ra, nếu bạn cảm thấy bí ý tưởng, Whisk cũng cung cấp tính năng ngẫu nhiên hóa các thành phần hình ảnh bằng cách chọn biểu tượng xúc xắc. Đối với những tác phẩm phức tạp hơn, bạn có thể thêm nhiều hơn một nguồn tham chiếu cho chủ thể, khung cảnh hoặc phong cách.
Khi đã hài lòng với tác phẩm của mình, bạn có thể lưu trữ trực tiếp trên nền tảng hoặc tải xuống để truy cập cục bộ.
Whisk: Công Cụ Đáng Giá Cho Sáng Tạo Ý Tưởng Hay Chỉ Là Một Thú Vị?
Với vô số lựa chọn tạo sinh hình ảnh AI tiên tiến hiện nay, từ việc nâng cao chất lượng ảnh đến tạo ra các tác phẩm nghệ thuật “độc đáo”, công cụ mới của Google thoạt nhìn có vẻ chỉ là một tính năng phụ trợ. Tuy nhiên, cách Whisk tận dụng các tham chiếu trực quan trong quá trình tạo ảnh là hoàn toàn độc đáo và có giá trị đáng kể trong cả các kịch bản sáng tạo lẫn chuyên nghiệp.
Ví dụ, bạn đang chuẩn bị một bản thuyết trình và cần những hình ảnh có phong cách tương tự với một tài liệu tham khảo đã có. Thay vì cố gắng diễn tả lại hình ảnh đó bằng lời, bạn có thể đơn giản tải tệp lên, kèm theo một mô tả văn bản ngắn gọn về những thay đổi bạn muốn có trong hình ảnh mới.
Để phân biệt Whisk với các phần mềm AI tạo ảnh khác, Google đã xác định rằng nền tảng này được thiết kế để khám phá ý tưởng, chứ không phải để tinh chỉnh chi tiết:
“Chúng tôi xây dựng nó để khám phá hình ảnh nhanh chóng, không phải để chỉnh sửa từng pixel. Mục đích là khám phá các ý tưởng theo những cách mới và sáng tạo, cho phép bạn thử hàng chục tùy chọn và tải xuống những thứ bạn yêu thích.”
Thực tế là đôi khi chúng ta rất khó tìm từ ngữ để diễn tả ý tưởng của mình. Với những lúc như vậy, Whisk mang lại tiềm năng to lớn, giúp chúng ta đơn giản hơn trong việc nói “Tôi muốn một hình ảnh trông giống như thế này.”
Whisk mở ra một hướng đi mới, giải quyết điểm nghẽn trong quá trình sáng tạo khi việc chuyển đổi ý tưởng trực quan thành mô tả văn bản trở nên khó khăn. Đây là một công cụ hứa hẹn sẽ thúc đẩy quá trình lên ý tưởng và thiết kế, đặc biệt cho những ai cần nhanh chóng thử nghiệm các phong cách và chủ đề khác nhau.