Dân mạng

Dân mạng "phát sốt" vì công cụ chỉnh sửa ảnh bằng AI mới của Google: Có người tự hỏi liệu Photoshop có còn cần thiết?

Thứ 2, 17/03/2025 12:52
Dù mới chỉ ra mắt vài ngày, nhưng công cụ AI mới của Google đã nhận được những lời phản hồi không thể tuyệt vời hơn.

Google vừa ra mắt Gemini 2.0 Flash Experimental, một công cụ AI chỉnh sửa ảnh mới đang tạo nên làn sóng phấn khích trong cộng đồng công nghệ. Với khả năng chỉnh sửa ảnh thông qua ngôn ngữ tự nhiên, nhiều người dùng đã bày tỏ sự kinh ngạc trước tiềm năng của công cụ này, thậm chí có người còn cho rằng, công cụ này còn có thể khai tử Photoshop trong tương lai.

Oriol Vinyals, một trong những người dùng đầu tiên, đã giới thiệu về khả năng tạo ảnh gốc của Gemini 2.0 Flash. Theo Vinyals, công cụ này có thể tạo ra những hình ảnh phù hợp với ngữ cảnh, chỉnh sửa thông qua trò chuyện và tạo văn bản dài trong hình ảnh - tất cả đều được tối ưu hóa cho việc tương tác qua chat.

gemini20flashdebutsnativeimagegen ezgifcom video to gif converter
Thay đổi các chi tiết trong ảnh chưa bao giờ đơn giản đến thế

Không chỉ vậy, Poonam Soni, một người dùng khác, còn chia sẻ cách đơn giản để sử dụng công cụ này: chỉ cần truy cập Google AI Studio, chọn mô hình 'Gemini 2.0 Flash Experimental', đảm bảo đã chọn "Images and text", sau đó tải lên hình ảnh và yêu cầu thay đổi bằng ngôn ngữ tự nhiên.

howitworks gotogoogleaistudio ezgifcom gif maker
Thao tác chỉnh sửa cũng đơn giản hơn nhiều nếu so với Photoshop

Người dùng có thể dễ dàng thay đổi màu sắc trang phục, sắp xếp nội thất trong ảnh, hay tạo ra ảnh hộ chiếu chỉ bằng cách nhập yêu cầu bằng ngôn từ tự nhiên. Ví dụ, một số bình luận cho biết việc thay đổi màu áo, chuyển đổi góc chụp từ mặt trước sang góc bên hay hậu cảnh đều được thực hiện một cách nhanh chóng và mượt mà, mang lại hiệu quả chỉnh sửa ấn tượng mà không cần phải dùng đến chuột, bàn phím hay các thao tác phức tạp như trên Photoshop.

gl8d1ufxeaamly
gl3ldazxaaa6vis
gl65px1bwaavbug
Thậm chí xoay ảnh từ trước ra sau 

Ngoài ra, tính năng chỉnh sửa văn bản trực tiếp trên hình ảnh cũng được nhiều người dùng đánh giá cao. Các thao tác như thêm chữ, xóa bỏ đối tượng không mong muốn hay ghép các phần của ảnh khác nhau chỉ cần đưa ra lệnh bằng lời nói.

gl3dbz6w4aabkjd
Nếu không phải là người chuyên dùng Photoshop, sẽ không dễ để thêm chữ vào hình ảnh như trên

Điều này không chỉ giúp tiết kiệm thời gian mà còn mở ra khả năng sáng tạo mới cho những người không chuyên trong lĩnh vực thiết kế đồ họa. Tuy nhiên, ví dụ trên chỉ là các chữ đơn giản, nhiều phản hồi khác cho thấy việc chỉnh sửa các văn bản phức tạp hơn sẽ dễ mắc lỗi hơn.

Giả sử bạn muốn thay đổi phông nền phía sau hình ảnh của mình - có thể dùng để minh họa cho lý do tại sao mình đi muộn - bạn chỉ cần mô tả được mong muốn của mình cho công cụ của Google.

gl9jwwywkaavdw9
Chỉ một câu lệnh và bạn có minh họa hoàn hảo cho lý do đi muộn của mình

Đáng chú ý là người dùng cũng cho thấy các nhân vật được tạo ra trong hình ảnh có thể duy trì tính nhất quán như thế nào. Trong bài đăng dưới đây, người dùng này cho biết, hình ảnh thứ 2 được người dùng tạo ra bằng ImageFX từ hình ảnh đầu, sau đó Gemini 2.0 Flash sẽ tạo ra các hình ảnh còn lại (hình ảnh thứ 3, thứ 4). Và cuối cùng tất cả được ghép lại bằng Sora AI để thành một clip ngắn.

gemini 20

Ngoài ra, người dùng Denis Shiryaev đã thử nghiệm một ứng dụng rất thực tế của công cụ này: khả năng khôi phục ảnh cũ và tô màu cho ảnh đen trắng, cho thấy tiềm năng lớn của Gemini 2.0 Flash, mặc dù vẫn còn một số hạn chế nhất định.

123gl3jqbrwmaa4g2c
Tô màu và phục chế ảnh cũ có lẽ chưa bao giờ dễ dàng đến thế

Tuy nhiên, Shiryaev cũng chỉ ra một số hạn chế của Gemini Flash 2.0. Một số tác vụ như xử lý độ phân giải cao hoặc chỉnh sửa văn bản trên ảnh, công cụ này vẫn chưa thể đáp ứng được mọi yêu cầu chuyên sâu. Các lỗi nhỏ như hiện tượng artifact trong quá trình colorize ảnh cũng được ghi nhận, cho thấy công nghệ vẫn cần được hoàn thiện thêm để đạt được sự ổn định và chính xác tối đa.

 

123gl3kjbixkaajiv0
Dù có thể tô màu cho ảnh cũ, nhưng nó lại mang đến cảm giác giả tạo trong hình ảnh cuối cùng

Điểm nổi bật của Gemini Flash 2.0 experimental còn nằm ở khả năng tương tác linh hoạt với hình ảnh. Người dùng có thể “điều khiển” ảnh theo ý muốn, từ việc thu phóng góc nhìn đến việc tạo ra những hình ảnh mang tính sáng tạo như làm cho một đối tượng “bay”, “duỗi” hay “co lại” chỉ bằng lời nói.

ezgifcom optimize
Chỉ bằng 2 bức ảnh, một người dùng có thể tạo ra hình ảnh quảng cáo phù hợp. Điều đáng ngạc nhiên là ngay cả nhãn dán trên chai nước cũng được giữ lại chính xác trong hình ảnh cuối.

Sự kết hợp giữa khả năng chỉnh sửa trực quan và hiệu suất làm việc ấn tượng đã khiến nhiều người tin rằng, trong tương lai gần, công cụ này có thể sẽ thay thế hoặc ít nhất là bổ sung những chức năng chỉnh sửa ảnh hiện có trên các phần mềm truyền thống.

Nếu bạn còn nhớ, những lần ra mắt các công cụ chỉnh sửa ảnh bằng AI trước đây của Google thường kết thúc với một sự cố đáng xấu hổ nào đó - từ việc sử dụng ảnh đã được chỉnh sửa trước cho đến tạo ra các bức ảnh mang tính thiên vị chủng tộc. Điều đó ít nhiều đã gây ra tiếng xấu cho Google đối với mảng công nghệ AI.

Tuy nhiên, các phản hồi từ cộng đồng cho thấy Google Gemini Flash 2.0 experimental đang mở ra một hướng đi mới cho lĩnh vực chỉnh sửa ảnh bằng cách tận dụng sức mạnh của trí tuệ nhân tạo và khả năng xử lý qua ngôn ngữ tự nhiên. Những ưu điểm vượt trội về tính đơn giản, tốc độ xử lý và khả năng sáng tạo đã được đông đảo người dùng đón nhận, trong khi các hạn chế nhỏ đang được cải tiến dần theo phản hồi thực tế. Đây hứa hẹn sẽ là bước tiến quan trọng, không chỉ đối với công cụ của Google mà còn cho toàn bộ ngành công nghiệp chỉnh sửa ảnh trong thời đại số.

Nguyễn Hải

Bình luận tiêu biểu (0)

Sắp xếp theo lượt thích | Sắp xếp theo ngày
Chưa có bình luận. Hãy là người đầu tiên bình luận bài viết này.
Cùng chuyên mục

Nam NSƯT đình đám: "Tôi bị cả xã hội lên án, nghĩ chạy theo tình trẻ để bỏ vợ già"

Thứ 2, 24/03/2025 16:14
"Đó là lỗi của tôi vì đã không giữ được vợ mình, chứ không phải những chuyện sa đọa, hư hỏng mà các bạn nghĩ đâu", Chí Trung tâm sự.

Thầy giáo Ba, Văn Tùng... bị tổng tấn công, nguyên nhân từ cái tên quen thuộc

Thứ 2, 24/03/2025 16:06
Drama về nhân vật này bất ngờ “hot” trở lại sau thời gian dài yên ắng khiến Thầy Giáo Ba, Văn Tùng… gặp “vạ”.

1 xu hướng du lịch bùng nổ, doanh thu dự kiến đạt 1.400 tỷ USD năm nay: Việt Nam cũng là điểm đến tiềm năng

Thứ 2, 24/03/2025 16:03
Ngành công nghiệp MICE (Hội họp, Khen thưởng, Hội nghị, Sự kiện) đang chứng kiến làn sóng chuyển đổi mạnh mẽ, hứa hẹn nhiều cơ hội bứt phá nhưng cũng đặt ra không ít thách thức.

Hàng Made in Russia tràn ngập Trung Quốc, Đại sứ quán Nga tức tốc vào cuộc vì 1 vấn nạn: Chuyện gì vậy?

Thứ 2, 24/03/2025 16:03
"Ở Nga chẳng có gì giống thế này cả", một khách hàng Nga vừa nói vừa cầm một chiếc xúc xích tại một cửa hàng ở Thượng Hải, trong khi người bán hàng ở phía sau yêu cầu cô ngừng quay phim.

Dùng drone bắn laser xuống đất, Trung Quốc vừa biết mình có bao nhiêu cây xanh trên cả nước

Thứ 2, 24/03/2025 16:01
Các nhà nghiên cứu đã đếm được số lượng cây xanh tại Trung Quốc và lập bản đồ phân bố của chúng trên toàn quốc nhờ vào công nghệ quét laser hiện đại có tên lidar.
    Xem thêm
Nổi bật trong ngày

Cảnh hàng trăm khán giả ùn ùn kéo lên sân khấu Anh trai vượt ngàn chông gai gây sốc nhất 

Chủ nhật, 23/03/2025 07:47
Cảnh tượng chưa từng có đã diễn ra tại Concert của Anh trai vượt ngàn chông gai. 

Bước ngoặt lớn với kinh tế Nga: Quyết định đã được đưa ra bất chấp lời đề nghị của ông Putin

Chủ nhật, 23/03/2025 10:06
Theo Reuters, quyết định của ngân hàng trung ương Nga đã được đưa ra bất chấp lời đề nghị và kêu gọi của Tổng thống Nga Putin.

Một tỉnh ở miền Trung dự kiến giảm hơn 300 phường xã

Chủ nhật, 23/03/2025 10:17
Địa phương này dự kiến sau sắp xếp chỉ còn 88 đến 95 đơn vị hành chính cấp xã thay vì 412 như hiện nay.

Đêm nào cũng nghe tiếng thở dài trong phòng con gái, người mẹ lén kiểm tra và phát hiện sự thật xót xa

Chủ nhật, 23/03/2025 15:33
Người mẹ không mong con trải qua những cảm giác như vậy.
xe.nguoiduatin.vn