Openai nâng cấp tạo ảnh trong Chatgpt chất lượng cao hơn

Thứ Hai, 24/03/2025 08:41

OpenAI vừa công bố tính năng mới mang tên Images in ChatGPT, cho phép người dùng tạo hình ảnh trực tiếp trong chatbot nhờ sức mạnh của mô hình GPT-4o.

Theo thông báo ngày 26/3, OpenAI cho biết bản phát hành ban đầu tập trung chủ yếu vào việc tạo ảnh, đồng thời mở quyền truy cập cho tất cả người dùng, bao gồm các gói Plus, Pro, Team và phiên bản miễn phí. Trước đó, ChatGPT cũng hỗ trợ tạo ảnh thông qua DALL·E, nhưng bị giới hạn về tính năng và số lần sử dụng miễn phí.

Sự ra mắt của công cụ này nhanh chóng thu hút sự chú ý trên mạng xã hội. Nhiều người dùng đã thử nghiệm và bày tỏ sự ngạc nhiên trước chất lượng hình ảnh. Hoàng Vy, một người dùng Facebook, chia sẻ: “Tôi không thể tin đây là ảnh AI nếu không có chú thích. Chất lượng tốt hơn hẳn so với các công cụ trước đây.” Trong khi đó, Công Tâm cảnh báo: “Tương lai, những hình ảnh trên mạng có thể không còn đáng tin nữa.” Thế Hà thì dự đoán: “Những người làm thiết kế và chỉnh sửa ảnh sẽ cần học cách tận dụng AI, nếu không họ có thể mất việc.”

*Ảnh AI: Isaac Newton Cầm Lăng Kính Giữa Công Viên Quảng Trường Washington.*

OpenAI nâng cấp khả năng tạo ảnh trong ChatGPT với công nghệ Binding và phương pháp hồi quy tự động

Theo The Verge, phát ngôn viên Taya Christianson của OpenAI cho biết, dù bản miễn phí bị giới hạn một số tính năng, khả năng tạo ảnh vẫn vượt trội so với DALL·E.

Trưởng nhóm nghiên cứu Gabriel Goh nhấn mạnh rằng, tính năng này có bước tiến lớn nhờ tích hợp GPT-4o, một trong những mô hình ngôn ngữ đa phương thức tiên tiến nhất của OpenAI. Một điểm đột phá là công nghệ Binding, giúp đảm bảo độ chính xác khi liên kết giữa thuộc tính và đối tượng trong hình ảnh. Ví dụ, nếu người dùng yêu cầu “một ngôi sao xanh và một tam giác đỏ”, hệ thống có thể tạo chính xác thay vì nhầm lẫn màu sắc như các mô hình trước đây.

Goh cho biết, nhờ công nghệ Binding, trình tạo ảnh trong ChatGPT có thể duy trì sự chính xác giữa 15-20 đối tượng mà không gây nhầm lẫn. Ngoài ra, khả năng hiển thị văn bản trên ảnh cũng được cải thiện, giúp văn bản rõ ràng, không bị biến dạng – điều mà nhiều mô hình AI trước đây gặp khó khăn.

Một trong những điểm khác biệt lớn của Images in ChatGPT so với các công cụ tạo ảnh khác là sử dụng phương pháp hồi quy tự động. Thay vì mô hình khuếch tán phổ biến, công nghệ này tạo ảnh theo thứ tự từ trái sang phải, từ trên xuống dưới, tương tự cách viết văn bản. Nhờ đó, hình ảnh có thể hiển thị chữ viết tốt hơn và duy trì tính nhất quán giữa các thành phần.

Trong buổi giới thiệu tính năng, OpenAI trình diễn các ví dụ như sơ đồ thí nghiệm lăng kính Newton, truyện tranh với lời thoại chính xác, và hình nền trong suốt cho logo hoặc thực đơn nhà hàng. Tuy nhiên, nhược điểm hiện tại là tốc độ tạo ảnh vẫn chậm hơn một số mô hình khác. Jackie Shannon, Giám đốc sản phẩm đa phương thức của OpenAI, khẳng định rằng đây là “sự đánh đổi hợp lý” để đảm bảo chất lượng.

Về mặt bảo mật, OpenAI đã tích hợp các biện pháp kiểm soát mạnh mẽ để ngăn chặn nội dung khiêu dâm, deepfake và hình ảnh sai lệch. Tất cả ảnh được tạo đều gắn siêu dữ liệu C2PA, giúp người dùng kiểm tra nguồn gốc. Dù hệ thống chưa hoàn hảo, OpenAI cam kết sẽ tiếp tục cải thiện để tăng cường bảo vệ và độ tin cậy của công cụ.

“Tất nhiên, không có hệ thống nào hoàn hảo, nhưng chúng tôi liên tục cải thiện biện pháp bảo vệ của mình”, Shannon nói thêm.