DALL-E là gì? Tổng quan về thuật toán vẽ tranh bằng AI

DALL-E là gì 

DALL-E được mô tả là công nghệ giúp người sử dụng có thể tạo ra các hình ảnh mã hóa chỉ bằng những gì mình mong muốn nhìn thấy thông qua các mô hình trí tuệ nhân tạo theo CNBC

Sau một quá trình nghiên cứu dài hơi, DALL-E 2 được ra mắt dưới sự phát triển của một công ty khởi nghiệp được hỗ trợ bởi Microsoft – OpenAI

Theo “cha đẻ” của DALL-E, cái tên này được lấy cảm hứng từ Salvador Dali – một nghệ sĩ Tây Ban Nha và chú robot WALL-E trong bộ phim cùng tên của Pixar. Đây là sản phẩm công nghệ thứ hai của OpenAI trong vòng chưa đầy một năm nhưng đã thu hút được nhiều sự chú ý của các chuyên gia. Generative Pre-training Transformer 3 hay còn gọi là GPT-3 là một sản phẩm trước đó của công ty đã gây ấn tượng mạnh với cộng đồng khi con robot này có thể tạo ra các đoạn văn ấn tượng và bắt chước con người một cách hoàn hảo nhất.

DALL-E 2 hoạt động như thế nào?

Một trong những chuyên gia tại OpenAI, Alex Nichol, đã sử dụng thư viện hình ảnh được tạo sẵn với mục đích giúp DALL-E có thể phô diễn khả năng của nó. Đó chính là khả năng tạo ra tác phẩm nghệ thuật mới từ những hình ảnh ban đầu được cung cấp.

Ví dụ bạn muốn nhìn thấy một bức ảnh có hình con cá lái xe chẳng hạn. Nghe có vẻ là một yêu cầu kỳ cục cho một chiếc máy để vẽ lại nhưng khi bạn cung cấp thuật ngữ “con cá” và “ô tô” cho con AI này, nó sẽ cố gắng tái hiện lại hình ảnh bạn miêu tả theo những gì nó biết.

Một số ví dụ về DALL-E

DALL-E thường cho ra những hình vẽ trông có vẻ khá đơn gainr nhưng tất cả đều là những sự phát triển cho thấy trí tuệ nhân tạo đang hành xử khá giống loài người

Tuy vậy, việc phát triển một cách quá nhanh như vậy đặt ra nhiều lo ngại về một tương lai khi AI có khả năng nhận thức như loài người và thực hiện 1 cuộc lật đổ

Như trong hình vẽ dưới đây, có thể thấy DALL-E đã vẽ rất chân thực hình ảnh 2 chú gấu trong phòng thí nghiệm chỉ từ những gợi ý của con người

sản phẩm của DALL-E
sản phẩm của DALL-E

Mark Riedl – phó giáo sư tại Trường Công nghệ Georgia về Điện toán Tương tác (Mỹ) cho biết: “Text-to-image (tính năng chuyển văn bản thành hình ảnh) rất mạnh mẽ ở chỗ nó mang lại cho người dùng khả năng diễn đạt những gì họ muốn thấy bằng ngôn ngữ. Ngôn ngữ rất phổ cập, trong khi khả năng nghệ thuật là một kỹ năng cần phải học qua thời gian. Nếu ai đó nảy ra ý tưởng tạo nhân vật hoạt hình Pikachu đang cầm gươm ánh sáng – lightsaber, có thể nó sẽ không phải là thứ mà người đó có thể ngồi xuống và vẽ ngay được kể cả khi đó là thứ mà họ có thể giải thích bằng lời.”

Hạn chế của DALL-E

Tuy vậy, không có gì là hoàn hảo trên thế giới này. Đôi khi, DALL-E vẫn còn hiểu sai ý nghĩa của các thuật ngữ mà con người nhập vào và cho ra kết quả ngoài ý muốn. Ví dụ với câu lệnh “đặt tháp Eiffel lên mặt trăng”, AI đã cho ra kết quả là đặt mặt trăng lên trên tháp. Công ty OpenAI vẫn đang hàng ngày cải tiến, tinh chỉnh kỹ năng của mạng nơ-ron bằng cách cung cấp một lượng dữ liệu lớn hơn.

Không chỉ tạo ảnh, DALL-E còn có thể chỉnh sửa ảnh nhanh chóng theo yêu cầu. Khi Nichol – một trong những người góp phần xây dựng DALL-E, xóa từ khóa chiếc kèn của gấu bông và yêu cầu cây đàn guitar thay vào đó, hình ảnh xuất hiện ngay lập tức.

Việc phát triển con AI này cũng đi kèm một số hậu quả khôn lường. Nhiều chuyên gia cho rằng khi DALL-E được phát triển hoàn thiện hơn, nó hoàn toàn có thể bắt đầu một chiến dịch gây bão dư luận trên Internet bằng cách lan truyền các thông tin sai sự thật.

“Bạn có thể dùng nó cho những việc tốt, nhưng chắc chắn cũng có thể sử dụng vào những mục đích điên rồ, đáng lo ngại khác, như tạo hình ảnh và video sai lệch”, Subbarao Kambhampati, Giáo sư khoa học máy tính tại Đại học bang Arizona, phát biểu.

Ai có thể sử dụng DALL-E 

Hiện OpenAI mới chỉ cho sử dụng DALL-E trong nội bộ và chưa ai bên ngoài đội phát triển AI này có thể sử dụng. Công ty có kế hoạch mở dịch vụ cung cấp DALL-E cho người có nhu cầu như họa sĩ, chuyên gia thiết kế đồ họa, người cần chỉnh sửa ảnh số… nhưng có thể chỉ ở quy mô nhỏ. Hệ thống cũng có các bộ lọc ngăn người sử dụng tạo hình ảnh không phù hợp. “Đây không phải là sản phẩm”, Mira Murati, trưởng bộ phận nghiên cứu của OpenAI cho biết. “Mục tiêu là có thể hiểu được những khả năng và hạn chế, trong khi cho phép chúng tôi giảm bớt khối lượng công việc”.

Dù vậy, một số công ty khác trên thế giới cũng có thể sớm tạo ra loại công nghệ tương tự DALL-E để ai cũng có thể tiếp cận. Boris Dayma, nhà nghiên cứu độc lập ở Houston, đã xây dựng và giới thiệu một phiên bản đơn giản hơn của công nghệ này, vốn chỉ dựa vào bài nghiên cứu đầu tiên của hệ thống DALL-E.

 

Bài viết DALL-E là gì? Tổng quan về thuật toán vẽ tranh bằng AI đã xuất hiện đầu tiên vào ngày Công nghệ số 247 - Trang kiến thức về công nghệ.



source https://congngheso247.net/dall-e-la-gi-tong-quan-ve-thuat-toan-ve-tranh-bang-ai/

Nhận xét

Bài đăng phổ biến từ blog này

Top 10 điện thoại pin trâu nhất hiện nay

Kiểm tra RAM máy tính một cách đơn giản nhất