Skip to content

Thủ Thuật 365

  • Sample Page

Thủ Thuật 365

  • Home » 
  • Tin Công Nghệ » 
  • OpenAI O3 & O4-mini: Bước Tiến Suy Luận Hình Ảnh Vượt Trội

OpenAI O3 & O4-mini: Bước Tiến Suy Luận Hình Ảnh Vượt Trội

By Administrator Tháng 8 9, 2025 0
Hình ảnh minh họa ChatGPT o4-mini diễn giải và mô tả chi tiết nội dung của một bức ảnh, thể hiện khả năng suy luận hình ảnh của mô hình.
Table of Contents

Vào ngày 16 tháng 4 năm 2025, OpenAI đã chính thức giới thiệu hai mô hình suy luận AI mới: o3 và o4-mini. Đây là một bước nhảy vọt đáng kể trong khả năng AI của công ty, điều được thể hiện rõ nét nhất qua khả năng suy luận hình ảnh hoàn toàn mới của chúng.

Khả Năng “Tư Duy” Với Hình Ảnh Của Các Mô Hình AI Mới

OpenAI cho biết các mô hình o3 và o4-mini có thể diễn giải bất kỳ hình ảnh nào mà người dùng tải lên, chẳng hạn như phác thảo trên bảng trắng, sơ đồ trong sách giáo khoa, hay một tệp PDF đồ họa. Theo thông báo ra mắt OpenAI o3 và o4-mini:

“Chúng không chỉ đơn thuần nhìn một hình ảnh – chúng tư duy với nó. Điều này mở ra một loại hình giải quyết vấn đề mới, kết hợp suy luận thị giác và văn bản, được thể hiện qua hiệu suất dẫn đầu trong các thử nghiệm đa phương thức.”

Khả năng phân tích hình ảnh này được tích hợp vào chuỗi suy luận (chain of thought reasoning) mà các mô hình thực hiện. Các mô hình AI có thể phóng to, xoay hoặc cắt ảnh để cải thiện quá trình xử lý. Chúng cũng thành thạo không kém khi làm việc với những hình ảnh có chất lượng thấp.

Hình ảnh minh họa ChatGPT o4-mini diễn giải và mô tả chi tiết nội dung của một bức ảnh, thể hiện khả năng suy luận hình ảnh của mô hình.Hình ảnh minh họa ChatGPT o4-mini diễn giải và mô tả chi tiết nội dung của một bức ảnh, thể hiện khả năng suy luận hình ảnh của mô hình.

Ví dụ, khi giải quyết một vấn đề khoa học liên quan đến sơ đồ, mô hình có thể phóng to vào một phần cụ thể của hình ảnh, thực hiện các phép tính bằng Python, sau đó tạo biểu đồ để giải thích kết quả tìm được.

Khả Năng Tự Chủ và Tích Hợp Công Cụ Động

Trong quá trình suy luận, o3 và o4-mini có thể tự động sử dụng tất cả các công cụ ChatGPT có sẵn, bao gồm duyệt web, thực thi mã Python và tạo hình ảnh. Khả năng tác nhân (agentic capability) này cho phép chúng tự động chọn công cụ ChatGPT lý tưởng cho một tác vụ cụ thể. Người dùng và nhà phát triển có thể thực hiện các quy trình làm việc đa bước và giải quyết các tác vụ phức tạp một cách hiệu quả.

Biến Thể O4-mini-high và Ứng Dụng Thực Tiễn

O4-mini-high là một biến thể của o4-mini, tiêu tốn nhiều thời gian và công sức tính toán hơn cho mỗi yêu cầu để mang lại kết quả chất lượng cao hơn. Một số kịch bản ứng dụng hàng ngày có thể kể đến là:

  • Tạo và đánh giá các nghiên cứu trong sinh học, kỹ thuật và các lĩnh vực STEM khác, cung cấp lý giải từng bước chi tiết và giải thích trực quan.
  • Tìm kiếm và tổng hợp thông tin từ nhiều nguồn khác nhau như cơ sở dữ liệu trực tuyến, báo cáo tài chính, dữ liệu thị trường và biểu đồ, để tạo ra các thông tin chi tiết (insights) trong kinh doanh.

Các mô hình này đã được huấn luyện thông qua học tăng cường (reinforcement learning), một khái niệm cốt lõi trong AI. Nhờ đó, chúng có thể xử lý các vấn đề mơ hồ tốt hơn, bởi vì chúng có thể suy luận khi nào nên sử dụng một công cụ cụ thể để đạt được kết quả mong muốn.

Các mô hình o3, o4-mini và o4-mini-high hiện đã có sẵn cho tất cả người dùng có tài khoản ChatGPT Plus, Pro và Team. Mô hình o3-pro dự kiến sẽ ra mắt trong những tuần tới. Bạn có thể tìm thấy chúng trong menu chọn mô hình. Người dùng miễn phí có thể trải nghiệm mô hình o4-mini bằng cách chọn tùy chọn “Think” trong trình soạn thảo trước khi gửi yêu cầu của họ.

Tại Sao Khả Năng Đa Phương Thức Của ChatGPT Lại Đáng Kinh Ngạc?

Bằng cách cho phép AI “tư duy với hình ảnh”, các mô hình mới của OpenAI có thể giải quyết các vấn đề trong thế giới thực đòi hỏi việc diễn giải cả văn bản và hình ảnh. Điều này bao gồm việc gỡ lỗi code từ ảnh chụp màn hình, đọc văn bản viết tay, phân tích sơ đồ khoa học hoặc trích xuất thông tin chi tiết từ các biểu đồ phức tạp. Kết quả là ChatGPT đã trở nên nhận biết ngữ cảnh tốt hơn.

Các mô hình giờ đây tự chủ hơn. Chúng cũng có thể hiệu quả hơn, tự động điều chỉnh một mô hình cụ thể cho từng tác vụ. Khi những tác nhân AI tự chủ này có thể xử lý các tác vụ phức tạp, đa bước, khả năng suy luận và trí tuệ thị giác của chúng trở nên cực kỳ quan trọng đối với các lĩnh vực như nghiên cứu, kinh doanh và công việc sáng tạo.

Tài liệu tham khảo

  • Thông báo ra mắt OpenAI o3 và o4-mini
Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

So Sánh Aperty và Retouch4Me: Phần Mềm AI Nào Tối Ưu Hơn Cho Chỉnh Sửa Ảnh Chân Dung?

Next post

YouTube Premium Lite Sắp Ra Mắt: Giải Pháp Tiết Kiệm Xem Video Không Quảng Cáo

Administrator

Related Posts

Categories Tin Công Nghệ OpenAI O3 & O4-mini: Bước Tiến Suy Luận Hình Ảnh Vượt Trội

GIMP 3.0 Chính Thức Ra Mắt: Bước Tiến Lịch Sử Cho Công Cụ Chỉnh Sửa Ảnh Miễn Phí

Categories Tin Công Nghệ OpenAI O3 & O4-mini: Bước Tiến Suy Luận Hình Ảnh Vượt Trội

Đặt ChatGPT Làm Công Cụ Tìm Kiếm Mặc Định Trên Safari iPhone: Hướng Dẫn Chi Tiết

Categories Tin Công Nghệ OpenAI O3 & O4-mini: Bước Tiến Suy Luận Hình Ảnh Vượt Trội

Grammarly Authorship: Giải Pháp Mới Giúp Chứng Minh Tính Nguyên Bản Của Bài Viết

Leave a Comment Hủy

Recent Posts

  • Teleparty Hay Discord: Nền Tảng Tối Ưu Cho Buổi Watch Party Cùng Bạn Bè?
  • Tăng Năng Suất Vượt Trội: 8 Widget iPhone Hàng Đầu Bạn Không Thể Bỏ Qua
  • Khai Thác Toàn Bộ Tiềm Năng Bo Mạch Chủ: Những Tính Năng Bạn Đang Bỏ Quên
  • Hướng Dẫn Chi Tiết Các Cách Số Hóa Ảnh Cũ Hiệu Quả Nhất
  • Cảnh báo: Tài khoản Samsung không hoạt động sẽ bị xóa vào 31/07/2025

Recent Comments

Không có bình luận nào để hiển thị.
Copyright © 2025 Thủ Thuật 365 - Powered by Nevothemes.
Offcanvas
Offcanvas

  • Lost your password ?