Akhirnya, DALL-E 2, sistem AI penghasil gambar OpenAI, tersedia sebagai API, yang berarti pengembang dapat membangun sistem ke dalam aplikasi, situs web, dan layanan mereka. Dalam posting blog hari ini, OpenAI mengumumkan bahwa pengembang mana pun dapat mulai memanfaatkan kekuatan DALL-E 2 — yang sekarang digunakan lebih dari tiga juta orang untuk menghasilkan lebih dari empat juta gambar sehari — setelah mereka membuat akun OpenAI API sebagai bagian dari beta publik.
Harga untuk DALL-E 2 API bervariasi menurut resolusi. Untuk gambar 1024×1024, biayanya $0,02 per gambar; 512×512 gambar adalah $0,018 per gambar; dan 256×256 gambar adalah $0,016 per gambar. Diskon volume tersedia untuk perusahaan yang bekerja dengan tim perusahaan OpenAI.
Seperti DALL-E 2 beta, API akan memungkinkan pengguna untuk menghasilkan gambar baru dari petunjuk teks (misalnya “kelinci berbulu melompat melalui bidang bunga”) atau mengedit gambar yang ada. Microsoft, mitra OpenAI yang dekat, memanfaatkannya di Bing dan Microsoft Edge dengan alat Image Creator-nya, yang memungkinkan pengguna membuat gambar jika hasil web tidak mengembalikan apa yang mereka cari. Aplikasi desain busana CALA menggunakan DALL-E 2 API untuk alat yang memungkinkan pelanggan menyempurnakan ide desain dari deskripsi teks atau gambar, sementara startup foto Mixtiles membawanya ke aliran penciptaan karya seni bagi penggunanya.
Tidak banyak dalam hal kebijakan yang berubah dengan peluncuran API, yang kemungkinan akan mengecewakan mereka yang takut bahwa sistem AI generatif seperti DALL-E 2 dirilis tanpa pertimbangan yang memadai untuk masalah etika dan hukum yang mereka ajukan. Seperti sebelumnya, pengguna terikat oleh persyaratan layanan OpenAI, yang melarang penggunaan DALL-E 2 untuk menghasilkan konten kekerasan, seksual, atau kebencian yang terang-terangan. OpenAI juga terus memblokir pengguna dari mengunggah gambar orang tanpa persetujuan mereka atau gambar yang tidak mereka miliki haknya, menggunakan campuran sistem pemantauan otomatis dan manusia untuk menegakkan ini.
Satu perubahan kecil adalah bahwa gambar yang dihasilkan dengan API tidak perlu berisi tanda air. OpenAI memperkenalkan watermarking selama DALL-E 2 beta sebagai cara untuk menunjukkan gambar mana yang berasal dari sistem, tetapi telah memilih untuk menjadikannya opsional dengan peluncuran API.
“Kami mendorong pengembang untuk mengungkapkan bahwa gambar dihasilkan oleh AI, tetapi tidak mengharuskan mereka menyertakan tanda tangan DALL-E 2,” Luke Miller, manajer produk di OpenAI yang mengawasi pengembangan DALL-E 2, mengatakan kepada gerakanpintar.com melalui email.
OpenAI juga menggunakan filter tingkat cepat dan gambar dengan DALL-E 2, meskipun filter yang dikeluhkan beberapa pelanggan terlalu bersemangat dan tidak akurat. Dan perusahaan telah memfokuskan sebagian dari upaya penelitiannya pada diversifikasi jenis gambar yang dihasilkan DALL-E 2, yang bertujuan untuk memerangi bias di mana sistem AI teks-ke-gambar diketahui menjadi korban (misalnya menghasilkan sebagian besar gambar putih laki-laki ketika diminta dengan teks seperti “contoh CEO”).
Tetapi langkah-langkah ini tidak meredakan setiap kritik. Pada bulan Agustus, Getty Images melarang unggahan dan penjualan ilustrasi yang dihasilkan menggunakan DALL-E 2 dan alat serupa lainnya, mengikuti keputusan serupa oleh situs termasuk Newgrounds, PurplePort, dan FurAffinity. CEO Getty Images Craig Peters mengatakan kepada The Verge bahwa larangan itu didorong oleh kekhawatiran tentang “masalah hak yang tidak tertangani,” karena set data pelatihan untuk sistem seperti DALL-E 2 berisi gambar berhak cipta yang diambil dari web.
Mencoba menemukan jalan tengah, saingan Getty Images Shutterstock baru-baru ini mengumumkan bahwa mereka akan mulai menggunakan DALL-E 2 untuk menghasilkan konten tetapi secara bersamaan meluncurkan “dana kontributor” untuk mengganti pencipta ketika perusahaan menjual pekerjaan untuk melatih sistem AI teks-ke-gambar . Ini juga melarang seni AI yang diunggah oleh pihak ketiga untuk meminimalkan potensi karya berhak cipta masuk ke platform.
Ahli teknologi Mat Dryhurst dan Holly Herndon mempelopori upaya yang disebut Source+ untuk memungkinkan orang melarang pekerjaan atau kemiripan mereka digunakan untuk tujuan pelatihan AI. Tapi itu sukarela. OpenAI belum mengatakan apakah akan berpartisipasi — atau memang, apakah akan pernah memperkenalkan alat swalayan untuk memungkinkan pemegang hak mengecualikan pekerjaan mereka dari pelatihan atau pembuatan konten.
Dalam sebuah wawancara, Miller mengungkapkan sedikit hal spesifik mengenai langkah-langkah mitigasi baru, kecuali bahwa OpenAI telah meningkatkan tekniknya untuk mencegah sistem menghasilkan konten yang bias, beracun, dan menyinggung yang mungkin dianggap tidak menyenangkan oleh pelanggan. Dia menggambarkan open API beta sebagai proses “iteratif”, yang akan melibatkan pekerjaan dengan “pengguna dan seniman” selama beberapa bulan ke depan saat OpenAI menskalakan infrastruktur yang mendukung DALL-E 2.
Tentu saja, jika DALL-E 2 beta merupakan indikasi, program API akan berkembang seiring waktu. Awalnya, OpenAI menonaktifkan kemampuan untuk mengedit wajah orang dengan DALL-E 2, tetapi kemudian mengaktifkan kemampuan tersebut setelah melakukan peningkatan pada sistem keamanannya.
“Kami telah melakukan banyak pekerjaan di sisi itu — baik melalui gambar yang Anda unggah dan petunjuk yang Anda kirim sejauh menyelaraskannya dengan kebijakan konten kami dan memanggang dalam berbagai mitigasi untuk memfilter pada tingkat yang cepat dan pada tingkat gambar untuk memastikannya sesuai dengan kebijakan konten kami. Jadi, misalnya, jika seseorang mengunggah gambar yang mengandung simbol kebencian atau darah kental — seperti konten yang sangat, sangat, sangat kejam — itu akan ditolak,” kata Miller. “Kami selalu memikirkan bagaimana kami dapat meningkatkan sistem.”
Tapi sementara OpenAI tampak bersemangat untuk menghindari kontroversi seputar Stable Diffusion, open source yang setara dengan DALL-E 2 yang telah digunakan untuk membuat film porno, gore, dan deepfake selebriti, terserah kepada pengguna API untuk memilih dengan tepat bagaimana dan di mana akan menyebarkannya. teknologinya. Beberapa, seperti Microsoft, tidak diragukan lagi akan mengambil pendekatan terukur, meluncurkan produk bertenaga DALL-E 2 secara perlahan untuk mengumpulkan umpan balik. Yang lain akan terjun lebih dulu, merangkul teknologi dan dilema etika yang menyertainya.
Jika ada satu hal yang pasti, ada permintaan terpendam untuk AI generatif — konsekuensinya terkutuk. Bahkan sebelum API secara resmi tersedia, pengembang menerbitkan solusi untuk mengintegrasikan DALL-E 2 ke dalam aplikasi, layanan, situs web, dan bahkan video game. Dengan peluncuran beta publik, didorong oleh kekuatan pemasaran OpenAI yang tangguh, gambar sintetis siap untuk benar-benar memasuki arus utama.