Công nghệ

Bây giờ bạn có thể chỉnh sửa hình ảnh ChatGPT, kiểu Photoshop



Bạn chắc chắn đã nhận thấy rất nhiều công cụ tạo tác phẩm nghệ thuật AI đã xuất hiện trong khoảng một năm trở lại đây: các công cụ siêu thông minh có thể tạo ra những bức ảnh trông giống như ảnh thật hoặc tác phẩm nghệ thuật do con người thực tạo ra. Thời gian trôi qua, chúng ngày càng trở nên mạnh mẽ và ngày càng bổ sung thêm nhiều tính năng—bạn thậm chí có thể tìm thấy công cụ nghệ thuật AI trong Microsoft Paint ngay bây giờ.

Điểm mới của mô hình hình ảnh AI DALL-E, dành cho các thành viên ChatGPT Plus đang trả 20 đô la một tháng, là khả năng chỉnh sửa các phần của hình ảnhgiống như bạn có thể làm trong Photoshop: Bạn không còn cần phải tạo lại một hình ảnh hoàn toàn mới chỉ vì bạn muốn thay đổi một thành phần của nó—bạn có thể hiển thị cho DALL-E phần hình ảnh mà bạn muốn điều chỉnh, cung cấp cho nó một số thông tin hướng dẫn mới và để yên mọi thứ khác.

Nó khắc phục một trong những hạn chế quan trọng của nghệ thuật AI, đó là mỗi hình ảnh (và video) là một thứ gì đó hoàn toàn độc đáo và khác biệt, ngay cả khi bạn đang sử dụng các lời nhắc giống hệt nhau. Điều đó khiến cho việc đạt được sự nhất quán giữa các hình ảnh hoặc tinh chỉnh một ý tưởng trở nên khó khăn. Tuy nhiên, những người sáng tạo nghệ thuật AI này, dựa trên những gì được gọi là mô hình khuếch tán, vẫn còn rất nhiều hạn chế cần khắc phục—như chúng tôi sẽ chỉ cho bạn ở đây.

Chỉnh sửa hình ảnh trong ChatGPT

Nếu bạn là người đăng ký ChatGPT Plus, bạn có thể tải ứng dụng trên web hoặc thiết bị di động và yêu cầu chụp ảnh bất cứ thứ gì bạn thích: một chú chó hoạt hình thám tử đang giải quyết một vụ án trong bối cảnh cyberpunk, phong cảnh đồi nhấp nhô với một cô đơn. hình ảnh ở khoảng cách giữa và những đám mây bão tụ tập trên đầu, hoặc bất cứ thứ gì. Sau vài giây, bạn sẽ có được hình ảnh của mình.

Để chỉnh sửa ảnh, bây giờ bạn có thể nhấp vào hình ảnh được tạo và sau đó nhấp vào Lựa chọn ở góc trên bên phải (trông giống như một cây bút đang viết nguệch ngoạc một dòng). Sau đó, bạn điều chỉnh kích thước của công cụ lựa chọn bằng cách sử dụng thanh trượt ở góc trên cùng bên trái và vẽ lên phần hình ảnh bạn muốn thay đổi.

Hình ảnh trò chuyệnGPT

Giao diện chỉnh sửa trong ChatGPT
Tín dụng: Lifehacker

Đây là một bước tiến quan trọng: Bạn có thể giữ nguyên một phần hình ảnh và chỉ cần làm mới vùng chọn. Trước đây, nếu bạn gửi lời nhắc tiếp theo yêu cầu thay đổi một phần cụ thể của ảnh, thì toàn bộ ảnh sẽ được tạo lại và có thể trông khác biệt đáng kể so với ảnh gốc.

Khi bạn đã lựa chọn xong, bạn sẽ được nhắc nhập hướng dẫn mới, chỉ dành cho phần được đánh dấu của hình ảnh. Như thường lệ với các công cụ nghệ thuật AI này, bạn càng cụ thể thì càng tốt: Bạn có thể yêu cầu một người trông vui vẻ hơn (hoặc kém hạnh phúc hơn) hoặc yêu cầu một tòa nhà có màu sắc khác. Sau đó, những thay đổi mà bạn yêu cầu sẽ được áp dụng.

Chỉnh sửa hình ảnh con chó

Thành công! ChatGPT và DALL-E đổi con chó này lấy con chó khác.
Tín dụng: Lifehacker / DALL-E

Dựa trên các thử nghiệm của tôi, ChatGPT và DALL-E dường như triển khai cùng một loại thủ thuật AI mà chúng tôi đã thấy với các ứng dụng như Magic Eraser của Google: Điền nền một cách thông minh dựa trên thông tin hiện có trong một cảnh, trong khi cố gắng để mọi thứ bên ngoài khung cảnh. lựa chọn không bị ảnh hưởng.

Đây không phải là công cụ lựa chọn tiên tiến nhất và tôi đã nhận thấy sự không nhất quán về đường viền và các cạnh của đối tượng—điều này có thể được mong đợi, khi xem xét mức độ kiểm soát mà bạn có được khi chọn. Trong nhiều trường hợp, tính năng chỉnh sửa hoạt động đủ tốt, mặc dù không phải lúc nào nó cũng đáng tin cậy, điều này chắc chắn là OpenAI sẽ tìm cách cải thiện trong tương lai.

Nơi nghệ thuật AI đạt đến giới hạn của nó

Tôi đã thử công cụ chỉnh sửa mới để thực hiện nhiều thủ thuật khác nhau. Nó làm tốt việc thay đổi màu sắc và vị trí của một con chó trên đồng cỏ, nhưng kém hiệu quả hơn trong việc giảm kích thước của một người đàn ông khổng lồ đứng trên thành lũy của một lâu đài—người đàn ông đó chỉ biến mất trong một mảng thành lũy mờ ảo, cho thấy AI đang ở cố gắng vẽ xung quanh anh ta nhưng không mấy thành công.

Trong bối cảnh cyberpunk, tôi yêu cầu thả một chiếc ô tô vào và không có chiếc ô tô nào xuất hiện. Trong một cảnh lâu đài khác, tôi yêu cầu quay con rồng đang bay quay mặt về hướng khác, chuyển từ màu xanh sang màu đỏ và có thêm ngọn lửa phun ra từ miệng. Sau một lúc xử lý, ChatGPT đã loại bỏ hoàn toàn con rồng.

Chỉnh sửa hình ảnh rồng

Thất bại! ChatGPT và DALL-E đã xóa con rồng thay vì thay đổi nó.
Tín dụng: Lifehacker / DALL-E

Tính năng này vẫn còn hoàn toàn mới và OpenAI chưa tuyên bố rằng nó có thể thay thế việc chỉnh sửa hình ảnh của con người vì rõ ràng là không thể. Nó sẽ được cải thiện, nhưng những sai lầm này giúp chỉ ra những thách thức nằm ở đâu đối với một số loại hình nghệ thuật do AI tạo ra.

Điều mà DALL-E và các mô hình tương tự rất giỏi là biết cách sắp xếp các pixel để đưa ra hình ảnh gần đúng về một lâu đài (ví dụ), dựa trên hàng triệu (?) lâu đài mà chúng đã được huấn luyện. Tuy nhiên, AI không biết lâu đài là gì: Nó không hiểu hình học hoặc không gian vật lý, đó là lý do tại sao lâu đài của tôi có các tháp pháo nhô lên từ hư không. Bạn sẽ nhận thấy điều này trong rất nhiều tác phẩm nghệ thuật do AI tạo ra liên quan đến các tòa nhà, đồ nội thất hoặc bất kỳ đồ vật nào không được hiển thị chính xác.

Nền trắng trơn

Nó khá trắng nhưng lại không hề “đơn giản”.
Tín dụng: Lifehacker / DALL-E

Về cốt lõi, các mô hình này là những cỗ máy xác suất không hiểu (chưa) những gì chúng thực sự đang hiển thị: Đó là lý do tại sao trong nhiều video OpenAI Sora, mọi người biến mất vào hư vô, bởi vì AI sắp xếp các pixel rất khéo léo chứ không theo dõi mọi người. Bạn cũng có thể đã đọc về việc AI đang gặp khó khăn trong việc tạo ra hình ảnh của các cặp đôi thuộc các chủng tộc khác nhau, bởi vì các cặp đôi thuộc cùng một chủng tộc có nhiều khả năng xảy ra hơn, dựa trên dữ liệu huấn luyện hình ảnh.

Một vấn đề khác gần đây đã được chú ý là các trình tạo nghệ thuật AI này không thể tạo ra nền trắng trơn. Đây là những công cụ cực kỳ thông minh theo nhiều cách, nhưng chúng không “suy nghĩ” giống như cách bạn hoặc tôi nghĩ và không hiểu những gì chúng đang làm giống như cách một nghệ sĩ con người hiểu—và điều quan trọng là phải chịu đựng điều đó trong tâm trí khi bạn sử dụng chúng.



Mẹo vặt hay | Mẹo vặt cuộc sống | Kiến thức hằng ngày

Tin cùng loại

Những gì nhìn thấy trên bầu trời đêm vào tháng 4 năm 2023

Mẹo Vặt

15 biểu tượng bạn nên thêm vào Trung tâm điều khiển của iPhone

Mẹo Vặt

Woot đang bán Meta Quest 2 với giá thấp nhất từ ​​trước đến nay

Mẹo Vặt