Mặc dù đã đạt được những bước tiến đáng kể kể từ khi ra mắt ban đầu, DALL-E vẫn còn xa mới đạt đến sự hoàn hảo. Công cụ tạo ảnh bằng AI này còn tồn tại nhiều vấn đề cần khắc phục, và chúng trở nên rõ ràng hơn khi bạn sử dụng thường xuyên. Sự thiếu nhất quán và kích thước không chính xác chỉ là một vài trong số đó.
1. DALL-E Vẫn Gặp Khó Khăn Với Văn Bản
Trong khi các công cụ AI nói chung vẫn chưa thực sự giỏi trong việc tạo văn bản trong hình ảnh, tôi cho rằng DALL-E là một trong những công cụ kém nhất về mặt này, sau khi đã thử nghiệm hàng chục trình tạo nghệ thuật AI khác. Bạn thường sẽ thành công hơn với các yêu cầu đơn giản, nhưng như ví dụ dưới đây, phần mềm vẫn gặp khó khăn trong việc viết đúng dấu phụ của từ “Café”.
Quán cà phê với lỗi chính tả trên biển hiệu được tạo bởi DALL-E
Trong nhiều thử nghiệm, DALL-E cũng đã viết sai chính tả văn bản của tôi—mặc dù tôi đã cung cấp các prompt rất rõ ràng và cố gắng sửa lỗi nhiều lần. Trong một số trường hợp khác, văn bản bị biến dạng. Bạn cũng sẽ nhận thấy rằng DALL-E không tạo ra văn bản dễ đọc cho các biển báo đường phố và các vật thể tương tự.
2. Không Thay Đổi Kích Thước Ảnh Khi Được Yêu Cầu
DALL-E hiểu khá tốt nhu cầu tạo ảnh, nhưng lại rất kém trong việc thay đổi kích thước ảnh theo yêu cầu. Ví dụ, tôi đã nhiều lần yêu cầu phần mềm thay đổi kích thước ảnh cho các bài đăng blog khác nhau; mỗi lần như vậy, DALL-E chỉ tạo lại một bức ảnh mới.
May mắn thay, việc cắt và thay đổi kích thước hình ảnh là khá đơn giản. Nhiều công cụ miễn phí, như Canva, cho phép bạn thực hiện điều này. Tuy nhiên, sẽ tốt hơn nếu có thể thực hiện mà không cần phụ thuộc vào phần mềm bên thứ ba.
3. Thất Bại Trong Việc Tạo Ảnh Siêu Thực (Photorealistic)
DALL-E không gặp quá nhiều vấn đề với độ sâu trường ảnh, nhưng tôi nghĩ rằng nó khá tệ trong việc tạo ra những hình ảnh siêu thực. Ví dụ, tôi đã yêu cầu AI tạo hình ảnh một chú chó Golden Retriever trên núi (mà không nói rõ loại ảnh cần tạo).
Hình ảnh chó Golden Retriever trên núi được tạo bằng DALL-E, trông thiếu chân thực
Mặc dù trông khá tốt, nhưng rõ ràng đây là một bức ảnh được tạo bằng AI. Vì vậy, tôi đã yêu cầu DALL-E làm cho nó trông siêu thực hơn. Ngược lại, hình ảnh lại trông giả hơn (và thành thật mà nói, có phần đáng sợ).
Thử nghiệm ảnh siêu thực của chó từ DALL-E cho kết quả không mong muốn
Sử dụng Photorealistic Custom GPT có thể giúp ích, nhưng bạn cần đăng ký trả phí để truy cập tính năng này. Nếu không, Adobe Firefly là một gợi ý hàng đầu trong số các công cụ tạo ảnh AI siêu thực khác.
4. Không “Lắng Nghe” Yêu Cầu Loại Trừ Chi Tiết
Một cách để viết prompt hiệu quả hơn trong Midjourney, ChatGPT và các công cụ AI khác là nói rõ điều bạn không muốn phần mềm thực hiện. Trong nhiều trường hợp, làm như vậy sẽ dẫn đến kết quả tốt hơn. Tuy nhiên, DALL-E lại là một ngoại lệ.
Trong nhiều lần, tôi đã yêu cầu DALL-E không bao gồm một số yếu tố nhất định trong bức ảnh. Thế nhưng, công cụ này vẫn thêm chúng vào. Đôi khi, việc tạo lại hình ảnh có thể giải quyết được, nhưng sẽ tốt hơn nếu không phải làm điều này. Ngược lại, tôi hiếm khi gặp vấn đề này khi sử dụng Adobe Firefly.
5. Sự Không Nhất Quán Trong Một Số Khía Cạnh Cụ Thể
Nhiều công cụ tạo nghệ thuật AI đều có điểm yếu; ví dụ, khi thử nghiệm Photo AI, nó đặc biệt kém trong việc tạo bàn tay. DALL-E cũng mắc lỗi về sự không nhất quán ở nhiều khía cạnh khác nhau.
Mặc dù DALL-E rất giỏi trong việc tạo ra các hình ảnh tổng quát, nhưng nó không phải lúc nào cũng tốt trong việc tạo ra hình ảnh người đang cầm đồ vật. Kỳ lạ thay, phần mềm này cũng kém trong việc tạo ra màn hình máy tính. Thông thường, nó chỉ cho ra một cụm hình dạng ngẫu nhiên. Yêu cầu phần mềm tắt màn hình máy tính đôi khi (nhưng không phải luôn luôn) có thể giúp ích.
6. Phong Cách Hình Ảnh Thiếu Nhất Quán
DALL-E có thể tạo ra nhiều loại hình ảnh khác nhau; bạn có thể tạo nghệ thuật AI trông giống như tranh vẽ, và cũng có thể tạo ra hình ảnh trông giống 3D hơn. Tuy nhiên, sự đa dạng trong việc tạo hình ảnh này đôi khi có thể dẫn đến các phong cách không nhất quán.
Khi yêu cầu DALL-E tạo ảnh, bạn phải cụ thể về những gì bạn muốn. Nếu không, bạn có thể nhận được bất cứ thứ gì. Đây không phải là vấn đề nếu bạn chỉ thử nghiệm với ứng dụng, nhưng lại là vấn đề nếu bạn muốn có một phong cách nhất quán trên toàn bộ hình ảnh.
7. Kích Thước Vật Thể (Artifact) Không Tỷ Lệ Chuẩn
Việc làm cho các vật thể trong hình ảnh của bạn trông tỷ lệ với kích thước thực tế là rất quan trọng nếu bạn quan tâm đến độ chính xác của bức ảnh. Thật không may, DALL-E đôi khi không thể làm cho các vật thể trông đúng như chúng nên có. Ví dụ, nếu bạn yêu cầu phần mềm tạo hình ảnh một người đang cầm điện thoại trong tay, điện thoại đôi khi sẽ quá lớn.
Ban đầu, tôi nghĩ rằng việc yêu cầu phần mềm tạo ảnh góc rộng hơn sẽ giải quyết được vấn đề. Tuy nhiên, điều này lại làm mọi thứ tệ hơn. Hơn nữa, nhân vật trong ảnh trông giả tạo. Thử các prompt chỉnh sửa DALL-E khác nhau có thể hiệu quả với bạn, nhưng tôi vẫn chưa tìm ra cách khắc phục cho vấn đề này.
Người cầm điện thoại với kích thước không tỷ lệ chuẩn được tạo bởi DALL-E
8. DALL-E Gặp Vấn Đề Khi Tạo Tài Liệu Bên Ngoài
Ban đầu, tôi nghĩ DALL-E sẽ là một cách tuyệt vời để tạo lịch cá nhân hóa, thiệp sinh nhật, hình nền điện thoại và nhiều thứ khác. Tuy nhiên, tôi nhanh chóng phát hiện ra rằng phần mềm này không làm tốt trong lĩnh vực này.
Ví dụ, tôi đã thử tạo bìa thiệp sinh nhật bằng DALL-E trong quá khứ. Tôi muốn tạo một hình ảnh trong ứng dụng và sau đó tải nó lên một dịch vụ như Moonpig. Thật không may, tôi liên tục nhận được một thiết kế bao gồm một chiếc thiệp sinh nhật bên trong bức ảnh.
Thiệp sinh nhật do DALL-E tạo ra có chứa hình ảnh thiệp bên trong
Nếu bạn thực sự muốn sử dụng DALL-E cho các loại thiết kế này, tôi khuyên bạn không nên nói rằng bạn sẽ sử dụng nó trên thiệp sinh nhật. Thay vào đó, hãy chỉ định chính xác những gì bạn muốn chương trình tạo ra. Sau đó, bạn có thể điều chỉnh kích thước sau. Có lẽ tốt nhất là chỉ tạo hình ảnh trong DALL-E và thêm văn bản trong một ứng dụng khác.
9. Tạo Ảnh Kém Chất Lượng Khi Yêu Cầu Nhiều Tùy Chọn
Đôi khi, tôi không biết chính xác thiết kế AI mà mình muốn sử dụng. Trong những trường hợp này, việc nhờ các trình tạo ảnh tạo ra nhiều biến thể hình ảnh có thể là hợp lý. Nhưng từ kinh nghiệm cá nhân, DALL-E thường khá “lười biếng” khi cung cấp cho tôi nhiều tùy chọn.
Trong nhiều trường hợp, các bức ảnh tôi nhận được thường trông rất giống nhau. Kết quả là, bạn phải thật cụ thể. Tôi cũng nhận thấy rằng việc tạo từng hình ảnh một đã hoạt động tốt hơn là yêu cầu nhiều biến thể cùng lúc.
Kết luận
Mặc dù DALL-E là một công cụ đáng dùng, nhưng nó không hoàn hảo và bạn sẽ gặp phải các vấn đề nhất định trong quá trình sử dụng. Ví dụ, công cụ này kém trong việc tạo ảnh siêu thực nếu không có Custom GPTs. Hơn nữa, DALL-E thường không loại bỏ các yếu tố mà tôi không muốn có trong ảnh. Tuy nhiên, tôi vẫn khuyên bạn nên thử DALL-E; hãy tự mình trải nghiệm để xem những vấn đề này có xuất hiện với bạn hay không.