DALL-E 2, produkt OpenAI, jest już dostępny dla każdego bez listy oczekujących. Od 29 września wystarczy rejestracja na stronie Open AI. Jeszcze niedawno na dostęp trzeba było oczekiwać od kilku do kilkunastu tygodni. Według informacji podanych przez OpenAI z modelu korzysta aktualnie półtora miliona użytkowników, generując codziennie dwa miliony obrazów. Darmowo otrzymuje się 100 kredytów, które można użyć na generowanie obrazów z tekstu lub dodawanie elementów do istniejących obrazów. Co miesiąc otrzymuje się kilka dodatkowych kredytów. Każdy z nich pozwala na wygenerowanie czterech wariantów obrazu. Dodatkowe kredyty można kupić w cenie około 60 gr za sztukę w pakietach zaczynających się od 15 dolarów. OpenAI pracuje nad udostępnieniem API dla DALL-E 2.
DALL-E 2 obok Stable Diffusion jest jednym z najbardziej zaawansowanych modeli sztucznej inteligencji służących do generowania obrazu na podstawie tekstowych zapytań. Nie jest niestety systemem otwartym w związku z tym, w przeciwieństwie do Stable Diffusion, nie da się go uruchomić lokalnie.
Pomimo imponujących osiągnięć, często przewyższających swoim realizmem inne rozwiązania badacze ustalili, że DALL-E 2 wciąż słabo radzi sobie z podstawową gramatyką. W badaniu, opublikowanym 25 października, przez badaczy z Hiszpańskiego uniwersytetu Rovira i Virgili, Uniwersytetu Teksaskiego i Uniwersytetu Nowojorskiego wskazano, że zrozumienie 8 podstawowych, powszechnie używanych, koncepcji gramatycznych stanowi problem degradujący jakość generowanych obrazów.
System nie potrafił generować realistycznych obrazów w przypadku niewielkich różnic w szyku wyrazów. Kuleje rozpoznawania strony podmiotu czynnego i biernego. Pojawiają się też problemy z zachowaniem wszystkich elementów przekazanych w tekście. Przykładem może być zapytanie “The man paints a picture of him/himself” gdzie w większości przypadków brakowało celu malowania (mężczyzny na portrecie) lub samej reprezentacji malowanego obrazu.
Stable Diffusion, w naszym teście, radziła sobie z gramatyką jeszcze gorzej. Może dlatego powstają już strony, na których znajdziemy przykłady odpowiednio skonstruowanych zapytań oraz porady w sprawie ich poprawnej konstrukcji, pomagające uzyskać satysfakcjonujący wynik.