Các mô hình Trí tuệ Nhân tạo (AI) hiện đại đang ngày càng phát triển mạnh mẽ, mang đến khả năng sáng tạo hình ảnh gần như “phép thuật”. Nhưng liệu AI có thể tái tạo lại sự tài tình, cảm xúc và tinh thần của những bức ảnh biểu tượng nhất thế kỷ 20 – những kiệt tác đã định hình lịch sử nhiếp ảnh? Bài viết này sẽ đi sâu vào việc thử nghiệm khả năng của AI trong việc tái tạo những khoảnh khắc lịch sử và nghệ thuật này, đồng thời phân tích những giới hạn mà công nghệ này vẫn còn phải đối mặt.
Vì Sao Chúng Tôi Thực Hiện Thử Nghiệm Này?
Với sự tiến bộ vượt bậc của các mô hình AI, có vẻ như chúng ta có thể tạo ra hầu hết mọi thứ chỉ bằng cách sử dụng các câu lệnh (prompt) phù hợp. Mục đích của thử nghiệm này là kiểm chứng xem liệu điều đó có thực sự đúng, đặc biệt trong lĩnh vực nhiếp ảnh – nơi ghi lại thực tế. Trong khi nhiều người sáng tạo lo ngại về sự thống trị trong tương lai của AI, các nhiếp ảnh gia nói chung vẫn được bảo toàn vị thế, bởi một lý do đơn giản: họ là người ghi lại thực tế.
Những bức ảnh mà bạn sẽ thấy trong bài viết này không chỉ là những tuyệt tác của nghệ thuật nhiếp ảnh mà còn là những “viên nang thời gian”, ghi lại một cách chân thực các giai đoạn lịch sử mà chúng được chụp. Một mô hình AI có thể tạo ra thứ gì đó với “cảm giác” tương tự, nhưng thật nực cười khi mong đợi một hình ảnh do AI tạo ra có thể mang bất kỳ ý nghĩa văn hóa quan trọng nào.
Công cụ chúng tôi lựa chọn để thử nghiệm là Fotor AI, một trình tạo ảnh từ văn bản (text-to-image generator) tương đối đơn giản nhưng thường mang lại kết quả ổn định. Mặc dù vậy, Fotor AI không phải là Midjourney hay DALL-E. Dù rất tốt cho nhiều phong cách nghệ thuật khác nhau, kỹ năng “nhiếp ảnh” của nó thường còn kém. Điều này đặc biệt đúng khi cố gắng yêu cầu mô hình khớp với thời kỳ của hình ảnh gốc.
AI Xử Lý Chủ Thể Con Người Như Thế Nào?
Dorothea Lange là huyền thoại đầu tiên được AI “xử lý”. Bức ảnh “Migrant Mother” là một trong những bức ảnh mang tính biểu tượng nhất mọi thời đại, và chúng tôi đã lầm tưởng rằng Fotor sẽ quen thuộc với nó.
Bức ảnh biểu tượng "Người mẹ di cư" của Dorothea Lange chụp một người mẹ đang ôm con trong Đại Khủng hoảng, thể hiện sự kiệt quệ và hy vọng mong manh.
Tuy nhiên, mô hình AI cụ thể này không giỏi về tên riêng, và chúng tôi về cơ bản phải mô tả chi tiết hình ảnh cho đến khi nó hiểu được ý đồ. Kết quả thu được khá ổn:
Hình ảnh được tạo bởi AI Fotor mô tả một người mẹ ôm hai đứa con trong bối cảnh Đại Khủng hoảng, với ánh sáng studio hiện đại và cảm xúc chưa chân thực.
Khi xem xét kỹ hơn, vấn đề lớn nhất là ánh sáng. Trong bản gốc, chủ thể được chiếu sáng bằng ánh sáng tự nhiên, trong khi AI lại mang đến cho “người mẹ” của chúng ta một kiểu ánh sáng studio hiện đại. Hình ảnh cũng trông quá “mượt” theo ý kiến của chúng tôi, mặc dù đây không phải là điều mà một chút nhiễu hạt phim không thể giải quyết.
Về bố cục, đây là một thất bại. Dorothea Lange đã cẩn thận sắp xếp khung hình để kể câu chuyện về một người bị ảnh hưởng bởi cuộc Đại Khủng hoảng, với từng chi tiết từ cắt cúp đến ánh sáng đều góp phần truyền tải thông điệp. Mặt khác, AI vẫn gặp khó khăn với các tầng ý nghĩa ẩn dụ, vì vậy không có điều gì trong số đó được chuyển tải vào kết quả cuối cùng.
Fotor cũng cung cấp tùy chọn sử dụng tính năng “image-to-image” (tạo ảnh từ ảnh), và điều này mang lại kết quả gần gũi hơn (ít nhất là về bố cục):
Ảnh AI Fotor được tạo từ ảnh gốc "Migrant Mother", tái hiện một người mẹ ôm con nhưng có dấu hiệu của bộ lọc làm đẹp và chất lượng giảm.
Mặc dù những hình ảnh này khó phân biệt, chúng tôi không hài lòng với kết quả vì Fotor dường như chỉ áp dụng một bộ lọc làm đẹp chất lượng thấp lên chủ thể. Nhưng nếu là một cảnh phức tạp hơn thì sao?
Bức ảnh lịch sử chụp cựu Tổng thống Richard Nixon đang dùng đũa trong bữa tiệc với các quan chức Trung Quốc, tượng trưng cho chuyến thăm quan trọng.
Đối với trường hợp này, chúng ta sẽ “tua nhanh” đến đầu những năm 70 và thử tái tạo bức ảnh “Nixon in China” của Oliver F. Atkins. Dưới đây là kết quả của Fotor. Điều đầu tiên bạn sẽ nhận thấy là Fotor dường như không biết Richard Nixon là ai (mô hình có lẽ sẽ “bùng nổ” nếu chúng tôi sử dụng câu lệnh “Watergate”).
Hình ảnh AI do Fotor tạo ra, mô tả một người đàn ông dùng đũa trong bữa tối với các quan chức Trung Quốc, chưa tái hiện chính xác nhân vật Nixon hay bối cảnh gốc.
Cốt lõi của bức ảnh thì có đó (bao gồm cả sự bối rối trước miếng thức ăn trên chiếc đũa), nhưng bố cục và bối cảnh lại quá khác biệt. Chúng tôi có lẽ sẽ không thể nhận ra hình ảnh do AI tạo ra này dựa trên bức gốc nếu chưa từng xem nó.
Chế độ image-to-image cho ra bố cục tương tự nhưng chất lượng tổng thể bị giảm sút nghiêm trọng. Khuôn mặt bị biến dạng, đây là một trong nhiều dấu hiệu của hình ảnh do AI tạo ra kém chất lượng.
Ảnh AI Fotor từ chế độ image-to-image tái hiện cảnh Nixon dùng bữa, cho thấy chất lượng hình ảnh suy giảm và khuôn mặt bị biến dạng.
AI Tái Tạo Cảnh Vật và Vật Thể Vô Tri Ra Sao?
Hãy bắt đầu với kiệt tác “The Hindenburg Disaster” của Sam Shere. Bức ảnh “ngàn năm có một” này vô cùng phức tạp, vì vậy nó sẽ là một thử thách tốt cho AI.
Bức ảnh lịch sử ghi lại thảm họa Zeppelin Hindenburg phát nổ và bốc cháy dữ dội, một khoảnh khắc phức tạp và đầy bi kịch.
Fotor ít nhiều đã hiểu được yêu cầu của chúng tôi.
Ảnh AI Fotor cố gắng tái tạo thảm họa Hindenburg, nhưng Zeppelin vẫn nguyên vẹn dù đang cháy và bố cục không khớp với ảnh gốc.
Chúng tôi sử dụng cụm từ “ít nhiều” bởi vì khinh khí cầu vẫn còn nguyên vẹn mặc dù nó đang bốc cháy. Nó cũng ở quá gần mặt đất và không thể tái tạo được bố cục của bản gốc.
Khi sử dụng hình ảnh gốc làm đầu vào, gần như không thể phân biệt hai hình ảnh:
Tái tạo thảm họa Hindenburg bằng AI Fotor qua image-to-image, hình ảnh quá giống gốc và chỉ thay đổi phong cách vẽ (watercolor/pastel).
Vậy còn một cảnh không dễ dàng nhận ra ngay lập tức thì sao? Bức ảnh “Cactus Hot Air Balloon” của Leon Gimpel hoàn toàn phù hợp.
Bức ảnh màu hiếm từ đầu thế kỷ 20, "Khinh khí cầu xương rồng" của Léon Gimpel, chụp hai khinh khí cầu tại Paris.
Đây cũng là một trong những ví dụ hiếm hoi về việc sử dụng nhiếp ảnh màu đầu thế kỷ 20, vì vậy thật thú vị khi xem liệu AI có thể tái tạo lại vẻ ngoài độc đáo đó không. Một tiết lộ nhỏ: nó không thể.
Hình ảnh AI Fotor về hai khinh khí cầu tại Paris, cho thấy bố cục và chủ thể khác biệt so với ảnh gốc, màu sắc không đúng thời kỳ.
Bối cảnh (Grand Palais, Paris) thì đúng, nhưng bố cục và các chủ thể hầu như không giống bản gốc. Màu sắc cũng không đúng với thời kỳ. Sử dụng hình ảnh gốc làm prompt đã cho kết quả tốt hơn nhiều:
Tái tạo bằng AI Fotor từ ảnh gốc "Khinh khí cầu xương rồng", cho thấy sự thay đổi phong cách thành watercolor/pastel mà không có cải thiện nội dung.
Tuy nhiên, có một vấn đề nhỏ. Có vẻ như Fotor chỉ đơn giản là tái tạo lại hình ảnh gốc theo phong cách nghệ thuật watercolor/pastel, mặc dù đã sử dụng các prompt phủ định để ngăn mô hình làm như vậy. Do đó, bạn không nên mong đợi nhiều về sự cải thiện ở đây.
AI Có Thể Tái Tạo Cảnh Quan và Cảnh Đô Thị Không?
Với việc sử dụng các bộ lọc đen trắng màu cam và vàng để chơi đùa với độ tương phản, cùng với cách tiếp cận điêu luyện trong phòng tối, phong cách của Ansel Adams dễ dàng nhận ra và rất khó để tái tạo.
Tác phẩm "Moonrise, Hernandez, New Mexico" của Ansel Adams, một bức ảnh phong cảnh đen trắng nổi tiếng với kỹ thuật tương phản bậc thầy.
Và tất nhiên, chúng tôi đã quyết định thử thách Fotor. Mặc dù cảnh không giống xa, nhưng độ tương phản lại gợi ý về phong cách của Ansel Adams.
Ảnh AI Fotor mô phỏng phong cách Ansel Adams với cảnh đêm sa mạc và mặt trăng, dù cảnh không tương tự nhưng có gợi ý về độ tương phản cao.
Chế độ image-to-image tốt hơn nhiều về tổng thể nhưng hình ảnh đã mất đi tất cả các chi tiết nhỏ.
Tái tạo ảnh Ansel Adams bằng AI Fotor qua image-to-image, tổng thể tốt hơn nhưng mất đi các chi tiết tinh xảo của cảnh quan.
Chúng tôi là một fan hâm mộ lớn của nhiếp ảnh đường phố, nhưng thật không may, hầu hết các bức ảnh đường phố mang tính biểu tượng vẫn chưa thuộc phạm vi công cộng. Do đó, bức ảnh nổi tiếng “Kissing the War Goodbye” của Victor Jorgensen sẽ là một lựa chọn tốt.
Bức ảnh "Kissing the War Goodbye" của Victor Jorgensen, ghi lại khoảnh khắc một thủy thủ hôn y tá tại Quảng trường Thời đại, biểu tượng kết thúc Thế chiến II.
Đúng như những gì bạn có thể mong đợi từ Fotor vào thời điểm này, kết quả cuối cùng khá tốt. Tuy nhiên, có hai vấn đề.
Ảnh AI Fotor tái hiện cảnh thủy thủ hôn y tá, cho thấy sự dàn dựng và ánh sáng studio, khác biệt so với tính tự nhiên của ảnh gốc.
Thứ nhất, nó giống một bức ảnh khác về cảnh này do Alfred Eisenstadt chụp, và thứ hai, giờ đây nó trông dàn dựng 100% (trong khi bản gốc thì không).
Về mặt kỹ thuật, ánh sáng giống ánh sáng studio hiện đại và bức ảnh quá tương phản theo ý muốn của chúng tôi. Hãy sử dụng hình ảnh gốc làm prompt:
Ảnh AI Fotor từ image-to-image tái tạo cảnh hôn ở Times Square, với chủ thể chính ổn nhưng khuôn mặt người nền bị biến dạng.
Kết quả này khá lẫn lộn. Mặc dù chúng tôi thích vẻ ngoài của các chủ thể chính, nhưng khuôn mặt của những người trong nền giờ đây trông thẳng như bước ra từ một bộ phim kinh dị – một điều không bao giờ tốt.
Kết Luận
Tổng thể, chúng tôi khá ấn tượng với một số tác phẩm của Fotor AI, nhưng kết quả quá không nhất quán. Midjourney và DALL-E vẫn chiếm ưu thế khi nói đến việc tạo hình ảnh dựa trên prompt, đặc biệt nếu bạn muốn tạo ra những bức ảnh trông chân thực. Dù AI có thể tạo ra những hình ảnh ấn tượng, nó vẫn còn một chặng đường dài để thực sự nắm bắt được chiều sâu cảm xúc, ý nghĩa văn hóa và sự chân thực không thể thay thế của những tác phẩm nhiếp ảnh kinh điển.
Bạn nghĩ sao về khả năng của AI trong việc tái tạo nghệ thuật nhiếp ảnh? Hãy chia sẻ quan điểm của bạn trong phần bình luận bên dưới!