Skip to content

Thủ Thuật 365

  • Sample Page

Thủ Thuật 365

  • Home » 
  • Thủ Thuật Máy Tính » 
  • Đánh Giá Chuyên Sâu: Khả Năng Tạo Ảnh Đột Phá của ChatGPT 4o So Với DALL-E Cũ

Đánh Giá Chuyên Sâu: Khả Năng Tạo Ảnh Đột Phá của ChatGPT 4o So Với DALL-E Cũ

By Administrator Tháng 8 12, 2025 0
Bàn tay người chơi hợp âm E thứ trên đàn guitar acoustic do DALL-E tạo
Table of Contents

OpenAI vừa tung ra một bản nâng cấp “khủng” cho khả năng tạo hình ảnh của ChatGPT, và đây thực sự là khoảnh khắc khiến người dùng phải kinh ngạc trước những gì trí tuệ nhân tạo có thể làm được. Thay vì đi sâu vào các con số kỹ thuật hay dung lượng mô hình, bài viết này sẽ tập trung vào việc minh họa trực quan những gì ChatGPT 4o có thể thực hiện, và so sánh trực tiếp hiệu suất của nó với mô hình DALL-E cũ hơn, đặc biệt trong các thử thách mà các AI tạo ảnh thường gặp khó khăn.

Mục tiêu của chúng tôi tại thuthuat365.net là cung cấp cái nhìn toàn diện và chuyên sâu về những tiến bộ công nghệ mới nhất, giúp độc giả hiểu rõ hơn về tiềm năng và giới hạn của AI trong lĩnh vực đồ họa. Bằng cách phân tích các ví dụ cụ thể, chúng ta sẽ thấy rõ sự khác biệt trong độ chân thực, chi tiết và khả năng hiểu ngữ cảnh của hai mô hình, qua đó khẳng định vị thế dẫn đầu của ChatGPT 4o trong cuộc đua AI tạo ảnh.

Cải Thiện Vượt Bậc Về Khả Năng Tạo Tay và Ngón Tay

Khi công nghệ AI tạo ảnh lần đầu tiên xuất hiện rộng rãi, nó đã gây chấn động. Nhưng sau đó, người dùng bắt đầu nhận ra một điểm yếu cố hữu: các hình ảnh do AI tạo ra thường có ngón tay và cấu trúc bàn tay kỳ lạ, không tự nhiên. Vì vậy, không có cách nào tốt hơn để kiểm tra các mô hình AI ngoài việc yêu cầu chúng tái hiện một hợp âm guitar phức tạp.

Để làm nổi bật sự tiến bộ, chúng tôi sẽ bắt đầu với kết quả từ mô hình DALL-E gốc, sau đó là mô hình tạo ảnh mới được tích hợp trong ChatGPT 4o.

Bàn tay người chơi hợp âm E thứ trên đàn guitar acoustic do DALL-E tạoBàn tay người chơi hợp âm E thứ trên đàn guitar acoustic do DALL-E tạo

Hình ảnh trên là kết quả của DALL-E. Mặc dù DALL-E có những hạn chế nhất định, nó thực sự đã xử lý khá tốt cấu trúc ngón tay và giải phẫu tổng thể ở đây. Tuy nhiên, hợp âm thì lại không đạt yêu cầu. Bàn tay đặt quá cao trên cần đàn để có thể chơi hợp âm E thứ. Nếu phóng to, bạn sẽ thấy cây đàn guitar có hơn bảy dây, và khoảng cách giữa các dây cũng không đồng đều.

Với những điểm đó, hãy cùng xem ChatGPT 4o thể hiện như thế nào.

Bàn tay người chơi hợp âm E thứ trên đàn guitar acoustic do ChatGPT 4o tạoBàn tay người chơi hợp âm E thứ trên đàn guitar acoustic do ChatGPT 4o tạo

Nếu không nói trước, bạn có thể nghĩ đây là một bức ảnh cũ từ thời tôi còn chơi guitar. ChatGPT 4o thực sự xuất sắc đến vậy. Sáu dây đàn, khoảng cách đều đặn, và hợp âm trông giống như E thứ. Kết quả này thực sự gây ấn tượng mạnh.

Khả Năng Tái Tạo Nhân Vật Lịch Sử

Sau khi kiểm tra khả năng xử lý tay và ngón tay, chúng ta hãy thử nghiệm với khuôn mặt. Chúng tôi quyết định chọn các nhân vật lịch sử, vì họ không thể bị “xúc phạm”, và sẽ thú vị khi thấy họ trong một bối cảnh hiện đại.

Yêu cầu: “Albert Einstein đang ăn kem ở Central Park, mặc áo sơ mi thường ngày và quần yếm.”

Người đàn ông giống Einstein ăn kem tại Central Park do DALL-E tạoNgười đàn ông giống Einstein ăn kem tại Central Park do DALL-E tạo

Đây là một sự thất vọng lớn. Công bằng mà nói, DALL-E đã cảnh báo rằng nó không thể sử dụng chính Einstein mà sẽ tạo ra một người “rất giống” ông. Một trong những đặc điểm dễ nhận biết của DALL-E là phong cách vừa hoạt hình vừa thực tế, điều này thể hiện rõ ràng ở đây. Tòa nhà San Remo ở hậu cảnh gợi ý rằng đây là Central Park, nhưng đó là điểm cộng duy nhất. Giờ hãy chuyển sang ChatGPT 4o.

Người đàn ông giống Einstein ăn kem tại Central Park do ChatGPT 4o tạoNgười đàn ông giống Einstein ăn kem tại Central Park do ChatGPT 4o tạo

Chỉ cần thêm một bộ lọc đen trắng, tôi có thể thuyết phục bạn rằng đây là một bức ảnh cổ điển có thật. Cây kem trông đúng điệu, Albert giữ được vẻ thờ ơ đặc trưng, và San Remo vẫn đứng sừng sững ở phía sau. Mọi thứ đều khớp. ChatGPT 4o đã hoàn thành xuất sắc.

Khả Năng Thể Hiện Nhân Vật Hư Cấu

Đến giờ chúng ta đã thấy ChatGPT có thể tạo hình nhân vật lịch sử rất tốt. Vì khuôn mặt và con người vẫn là một trong những cách tốt nhất để thử thách AI, hãy thử thêm một số ví dụ khác.

Yêu cầu: “Một nhân vật giống Chúa tể Sith đang gọi taxi ở George Square, Glasgow, với mưa nhẹ và đèn giao thông ở hậu cảnh.”

Nhân vật cao lớn, bí ẩn giống Chúa tể Sith đứng ở George Square, Glasgow do DALL-E tạoNhân vật cao lớn, bí ẩn giống Chúa tể Sith đứng ở George Square, Glasgow do DALL-E tạo

Chúng tôi sử dụng từ “giống” để bot hợp tác mà không bị vướng mắc về bản quyền. Kết quả của DALL-E khá ổn. Nhân vật gợi nhớ đến một Chúa tể Sith, và các yếu tố khác ít nhiều cũng chính xác. Hình ảnh không hề hoạt hình, nhưng nó không mang lại cảm giác chân thực. Muốn chân thực? Hãy xem ChatGPT 4o đã tạo ra gì với cùng một prompt:

Nhân vật cao lớn, bí ẩn giống Chúa tể Sith đứng ở Glasgow do ChatGPT 4o tạoNhân vật cao lớn, bí ẩn giống Chúa tể Sith đứng ở Glasgow do ChatGPT 4o tạo

Tôi yêu không khí của bức ảnh này—ánh sáng, mưa phùn, và sự hiện diện u ám của Chúa tể Sith. Mọi thứ đều ở đó. Vấn đề duy nhất là chúa tể bóng tối của chúng ta đang đứng giữa đường gọi taxi nhưng lại đối mặt với… vỉa hè. Ồ, và biển hiệu taxi viết “TAXL” thay vì “TAXI”.

Hãy chuyển từ khoa học viễn tưởng tương lai sang viễn tưởng lịch sử. Một yêu cầu như: “Một nhân vật giống Geralt of Rivia đang mua sắm tại một siêu thị hiện đại, đẩy xe hàng và nhíu mày nhìn các lon thực phẩm đóng hộp.”

Người đàn ông tóc trắng vạm vỡ, có vết sẹo trên mặt, giống thợ săn quái vật giả tưởng, đang mua sắm trong siêu thị hiện đại do DALL-E tạoNgười đàn ông tóc trắng vạm vỡ, có vết sẹo trên mặt, giống thợ săn quái vật giả tưởng, đang mua sắm trong siêu thị hiện đại do DALL-E tạo

Không tệ chút nào. Hình ảnh vẫn mang phong cách hoạt hình tổng hợp và văn bản trên hộp ngũ cốc hoàn toàn là “ngôn ngữ lạ” như mong đợi.

ChatGPT 4o ban đầu từ chối prompt vì vấn đề bản quyền, nhưng đã hoạt động khi chúng tôi đổi “similar to” thành “resembling”. Hãy xem:

Người đàn ông tóc trắng vạm vỡ, có vết sẹo trên mặt, giống thợ săn quái vật giả tưởng, đang mua sắm trong siêu thị hiện đại do ChatGPT 4o tạoNgười đàn ông tóc trắng vạm vỡ, có vết sẹo trên mặt, giống thợ săn quái vật giả tưởng, đang mua sắm trong siêu thị hiện đại do ChatGPT 4o tạo

Tôi thực sự không thốt nên lời. Giống như hầu hết mọi người, ChatGPT diễn giải Geralt chủ yếu là Henry Cavill chứ không phải phiên bản trong trò chơi điện tử, nhưng nó đã làm rất tốt. Nét cau mày rất đúng, và bối cảnh cũng rất tự nhiên. Bức ảnh này có thể được sử dụng làm cảnh quay trong một quảng cáo crossover kỳ lạ.

Tạo Hình Ảnh Phong Cách Hoạt Hình

Khả năng tạo ảnh của OpenAI không chỉ giới hạn ở phong cách chân thực. Mặc dù DALL-E luôn có xu hướng hơi “mờ ảo” bất kể bạn yêu cầu gì, chúng tôi quyết định đẩy cả hai mô hình vào chế độ hoạt hình hoàn toàn.

Yêu cầu: “Một thuyền trưởng cướp biển phong cách hoạt hình với áo khoác đỏ dài và cánh tay cybernetic, đang cười trên boong một con tàu bay. Nền trong suốt.”

Thuyền trưởng cướp biển phong cách hoạt hình đứng trên boong tàu bay do DALL-E tạoThuyền trưởng cướp biển phong cách hoạt hình đứng trên boong tàu bay do DALL-E tạo

DALL-E thực sự đã làm khá tốt ở đây, và nó thậm chí còn hiểu yêu cầu về nền trong suốt. Hay ít nhất là một phần. Cái chúng ta nhận được là mẫu nền bàn cờ màu xám-trắng cổ điển thường có nghĩa là trong suốt… nhưng ở đây, nó lại được “nướng” vào hình ảnh. Vậy nên, hoàn toàn không trong suốt. Trớ trêu thay, bàn tay sinh học của tên cướp biển AI của chúng ta có bốn ngón, trong khi cánh tay cybernetic lại có năm. Có lẽ hắn đã “thay nhầm” cánh tay?

Thuyền trưởng cướp biển phong cách hoạt hình đứng trên boong tàu bay do ChatGPT 4o tạoThuyền trưởng cướp biển phong cách hoạt hình đứng trên boong tàu bay do ChatGPT 4o tạo

Phiên bản của ChatGPT 4o sắc nét hơn và có chủ đích hơn. Phong cách màu sắc khác biệt, dù tốt hơn hay không là tùy cảm nhận, nhưng rõ ràng nó trông như thể một nghệ sĩ đã cố ý vẽ như vậy. Nền ảnh cũng thực sự trong suốt. Bạn có thể in nó lên áo phông, in ra giấy, hoặc thậm chí biến nó thành hình dán WhatsApp ngay lập tức.

Thử Thách Với Gương và Phản Chiếu

Gương phản chiếu và các phản chiếu cần có logic không gian để trông tự nhiên. Chúng tôi đưa ra một prompt mà chúng tôi biết DALL-E sẽ gặp khó khăn.

Yêu cầu: “Một bồn rửa hiện đại trong phòng tắm với bàn chải đánh răng và dao cạo trên mặt bàn, cả hai đều hiển thị trong gương và trong thế giới thực—ánh sáng mềm mại và đều.”

Bồn rửa phòng tắm hiện đại với thiết kế bóng bẩy và mặt bàn sạch sẽ do DALL-E tạoBồn rửa phòng tắm hiện đại với thiết kế bóng bẩy và mặt bàn sạch sẽ do DALL-E tạo

Đúng như dự đoán. Có một thứ gì đó cố gắng trở thành phản chiếu từ vòi nước trong gương, nhưng nó quá dài. Bàn chải đánh răng thì lơ lửng bên trong bồn rửa và không tạo ra bất kỳ phản chiếu nào. DALL-E thực sự đã “đeo chiếc mũ AI” của mình cho thử thách này.

Bồn rửa phòng tắm hiện đại với thiết kế bóng bẩy và mặt bàn sạch sẽ do ChatGPT 4o tạoBồn rửa phòng tắm hiện đại với thiết kế bóng bẩy và mặt bàn sạch sẽ do ChatGPT 4o tạo

Mô hình mới làm tốt hơn nhiều trong việc tạo ra hình ảnh chân thực, giống một bức ảnh thật. Phản chiếu của vòi nước hơi lệch nhưng chấp nhận được. Sau đó là bàn chải đánh răng, có phản chiếu nhưng lại không tồn tại trong thế giới vật lý—giống như một ma cà rồng ngược.

Không có người thắng rõ ràng ở đây. Kết quả AI không nhất quán, vì vậy chúng tôi đã thử lại cả hai với một yêu cầu tham vọng hơn một chút:

“Một người phụ nữ đứng trước gương toàn thân trong phòng ngủ tràn ngập ánh nắng, trang phục và tư thế của cô ấy được phản chiếu chính xác, với hình ảnh cửa sổ phía sau cô ấy cũng hiển thị rõ trong gương.”

Người phụ nữ đứng trước gương toàn thân trong phòng ngủ tràn ngập ánh nắng do DALL-E tạoNgười phụ nữ đứng trước gương toàn thân trong phòng ngủ tràn ngập ánh nắng do DALL-E tạo

Tôi thậm chí không muốn phân tích bức ảnh này. Nếu bạn muốn làm DALL-E trông tệ, chỉ cần thêm từ “gương” vào prompt của bạn. Chuyển sang phần tiếp theo.

Người phụ nữ đứng trước gương toàn thân trong phòng ngủ tràn ngập ánh nắng do ChatGPT 4o tạoNgười phụ nữ đứng trước gương toàn thân trong phòng ngủ tràn ngập ánh nắng do ChatGPT 4o tạo

Đúng như mong đợi, phiên bản của ChatGPT 4o trông thực tế hơn nhiều—nhưng có lẽ hơi siêu thực lần này? Tư thế và trang phục của người phụ nữ được phản chiếu, nhưng chỉ một phần, giống như hiệu ứng bật ra 3D của Photoshop. Các góc phản chiếu cũng bị lệch. AI vẫn chưa thể xử lý logic không gian một cách hoàn hảo.

Độ Chính Xác Với Ô Tô và Bối Cảnh Đường Phố

Với vai trò là một người đam mê ô tô, một trong những điều đầu tiên tôi thử khi các AI tạo ảnh mới xuất hiện là tạo ra những bức ảnh về xe hơi. Kết quả lúc đó không mấy khả quan, nhưng với mô hình mới, tôi phải thử lại.

Yêu cầu: “Một chiếc Ford GT đời 2006 và một chiếc Peugeot 206 phía sau đèn giao thông màu đỏ trên phố Wall Street, New York, vào giữa trưa.”

Chiếc Ford GT đời 2006 đang dừng ở đèn giao thông đỏ cạnh chiếc Peugeot 206 do DALL-E tạoChiếc Ford GT đời 2006 đang dừng ở đèn giao thông đỏ cạnh chiếc Peugeot 206 do DALL-E tạo

DALL-E lại với phong cách hoạt hình ngày càng khó chịu của nó. Chiếc Peugeot nằm trên vỉa hè, đèn giao thông tôi yêu cầu thì quay mặt vào các tòa nhà, và biển số xe đều là chữ “ngôn ngữ lạ”.

Chiếc Ford GT đời 2006 đang dừng ở đèn giao thông đỏ cạnh chiếc Peugeot 206 trong khung cảnh đường phố do ChatGPT 4o tạoChiếc Ford GT đời 2006 đang dừng ở đèn giao thông đỏ cạnh chiếc Peugeot 206 trong khung cảnh đường phố do ChatGPT 4o tạo

Kết quả của ChatGPT 4o tốt hơn đáng kể. Các chiếc xe được miêu tả đúng—ngay cả nắp bánh xe của Peugeot cũng chính xác và đúng với thời đại. Kiểu chi tiết này không phải ngẫu nhiên. Nhưng điều thú vị hơn là:

Chiếc Ford GT đời 2006 đang dừng ở đèn giao thông đỏ cạnh chiếc Peugeot 206 trong chi tiết cận cảnh do ChatGPT 4o tạoChiếc Ford GT đời 2006 đang dừng ở đèn giao thông đỏ cạnh chiếc Peugeot 206 trong chi tiết cận cảnh do ChatGPT 4o tạo

Tôi thực sự có thể sử dụng bức ảnh này làm hình nền điện thoại của mình. Ánh sáng, bố cục, các phản chiếu—mọi thứ đều khớp. Ngoài sự vắng vẻ kỳ lạ của con phố, bức ảnh này có thể dễ dàng bị nhầm là một bức ảnh thật.

Xử Lý Văn Bản và Chữ Viết Trong Hình Ảnh

Cuối cùng, chúng ta nhắm vào điểm yếu chí mạng của mọi công cụ tạo ảnh AI. Hầu hết các AI tạo ảnh đều gặp khó khăn khi xử lý văn bản một cách chính xác. Bạn đã thấy đủ những chữ “ngôn ngữ lạ” từ DALL-E trong các ví dụ trước đó để hiểu ý tôi.

Để làm cho nó thú vị và nhất quán hơn, chúng tôi đã thêm yêu cầu bức thư phải chứa văn bản bài phát biểu của Vua Terenas gửi Arthas từ Warcraft III.

Yêu cầu: “Một bức thư viết tay trên giấy cổ điển với chữ viết thư pháp, đặt cạnh một cây bút máy và một lọ mực.”

Cảnh cận cảnh bức thư viết tay trên giấy da hơi ngả vàng do DALL-E tạoCảnh cận cảnh bức thư viết tay trên giấy da hơi ngả vàng do DALL-E tạo

DALL-E đã làm những gì nó giỏi nhất với văn bản: biến nó thành một mớ chữ nhòe nhoẹt, không thể đọc được. Nó đã cố gắng viết đúng một vài từ, và không khí chung của bức ảnh cũng ổn—bút và lọ mực trông vững chắc.

Cảnh cận cảnh bức thư viết tay trên giấy da hơi ngả vàng do ChatGPT 4o tạoCảnh cận cảnh bức thư viết tay trên giấy da hơi ngả vàng do ChatGPT 4o tạo

ChatGPT 4o đã làm xuất sắc—từng từ một, với chữ viết thư pháp rõ ràng. Hoàn hảo đến từng ký tự. So với DALL-E, đây là một bước tiến vượt bậc. Xin chúc mừng, OpenAI.

Kết Luận

Công nghệ tạo ảnh AI đã đi một chặng đường dài, và điều đó thể hiện rõ nét qua bản nâng cấp mới của ChatGPT. ChatGPT 4o mang lại cảm giác đây là mô hình đầu tiên thực sự “hiểu” về ánh sáng, kết cấu và ngữ cảnh. Khả năng tái tạo chi tiết phức tạp như ngón tay, các đặc điểm nhận dạng của nhân vật, và đặc biệt là văn bản trong hình ảnh, đã được cải thiện đáng kể, vượt xa những gì DALL-E cũ có thể làm được.

Mặc dù vẫn còn một số thách thức với logic không gian phức tạp như phản chiếu, nhưng sự tiến bộ trong việc tạo ra các hình ảnh chân thực, sống động và chính xác về mặt chi tiết của ChatGPT 4o là không thể phủ nhận. Đây là một bước nhảy vọt quan trọng, mở ra nhiều tiềm năng ứng dụng trong các lĩnh vực từ sáng tạo nội dung, thiết kế, đến giải trí.

Tại thời điểm này, câu hỏi thực sự còn lại là: các biện pháp bảo vệ của ChatGPT mạnh đến đâu? Chúng ta đã dễ dàng vượt qua các hạn chế về bản quyền. Sẽ mất bao lâu trước khi ai đó tìm cách “bẻ khóa” (jailbreak) ChatGPT và bắt đầu tạo ra bất kỳ nội dung nào họ muốn bằng mô hình cực kỳ mạnh mẽ này?

Chúng tôi luôn muốn nghe ý kiến từ cộng đồng. Bạn nghĩ sao về khả năng tạo ảnh mới của ChatGPT 4o? Hãy chia sẻ trải nghiệm và quan điểm của bạn trong phần bình luận bên dưới!

Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

Brave Search Bổ Sung Tính Năng Rerank: Cá Nhân Hóa Kết Quả Tìm Kiếm Theo Ý Bạn

Next post

5 Công Cụ Nén Ảnh Online Hiệu Quả Nhất Bạn Đang Bỏ Lỡ

Administrator

Related Posts

Categories Thủ Thuật Máy Tính Đánh Giá Chuyên Sâu: Khả Năng Tạo Ảnh Đột Phá của ChatGPT 4o So Với DALL-E Cũ

Khám Phá Nhiếp Ảnh Macro Tuyệt Vời Với iPhone 16 Thường: Hướng Dẫn Chi Tiết

Categories Thủ Thuật Máy Tính Đánh Giá Chuyên Sâu: Khả Năng Tạo Ảnh Đột Phá của ChatGPT 4o So Với DALL-E Cũ

3 Ứng Dụng Microsoft Ẩn Cực Hay Nâng Tầm Trải Nghiệm PC

Categories Thủ Thuật Máy Tính Đánh Giá Chuyên Sâu: Khả Năng Tạo Ảnh Đột Phá của ChatGPT 4o So Với DALL-E Cũ

Reclaim.ai: Giải Pháp AI Giúp Tối Ưu Lịch Trình và Quản Lý Thời Gian Hiệu Quả

Leave a Comment Hủy

Recent Posts

  • Khám Phá Nhiếp Ảnh Macro Tuyệt Vời Với iPhone 16 Thường: Hướng Dẫn Chi Tiết
  • Airbnb Cập Nhật Lớn: Nâng Tầm Trải Nghiệm Du Lịch Với Dịch Vụ và Ứng Dụng Mới
  • 3 Ứng Dụng Microsoft Ẩn Cực Hay Nâng Tầm Trải Nghiệm PC
  • Reclaim.ai: Giải Pháp AI Giúp Tối Ưu Lịch Trình và Quản Lý Thời Gian Hiệu Quả
  • Đánh Giá Ugreen Uno Charger 100W: Sạc Nhanh Đa Năng Cho Mọi Thiết Bị

Recent Comments

Không có bình luận nào để hiển thị.
Copyright © 2025 Thủ Thuật 365 - Powered by Nevothemes.
Offcanvas
Offcanvas

  • Lost your password ?