Sztuczna inteligencja zagląda w wiele miejsc pomagając nam w codziennej pracy, przy okazji bawiąc za każdym razem gdy przy naszej pomocy stworzy coś zaskakująco dobrego lub zaskakująco słabego, niekiedy wręcz głupiego.
Do tej pory w kontekście sztucznej inteligencji pisałem głównie w odniesieniu do treści publikowanych na stronach internetowych. Na tym polu też dzieje się bardzo dużo, ale publikacje potrzebują ilustracji. I jak się okazuje w tym także AI jest w stanie nam pomóc i robi to coraz lepiej.
Gdy chcemy czymś przyozdobić nasz nowy artykuł pierwsze co przychodzi nam na myśl, to obrazy, grafiki, zdjęcia… Zaczyna się ich poszukiwanie na stockach (jeszcze) lub z wykorzystaniem takich narzędzi jak Canva, VistaCreate i im podobnych. Zazwyczaj znajdujemy coś co mniej lub bardziej nam odpowiada, wrzucamy to do tekstu na stronie i publikujemy.
Warto jednak mieć świadomość, że to co znajdziemy na stronach bezpłatnych i płatnych banków zdjęć, zazwyczaj jest wykorzystywane przez wielu właścicieli stron na całym świecie. Pozbywamy się w ten sposób pierwiastka unikalności na rzecz łatwego pozyskania obrazu.
Pobierz fotkę z takiego miejsca i wrzuć do graficznych wyników wyszukiwania Google. Zazwyczaj zobaczysz wiele miejsc w sieci, które to zdjęcie lub ten obraz już wykorzystuje.
Google rzecz jasna to widzi i o ile nie ma nic przeciwko, to z pewnością wartościowsze dla wyszukiwarki będą obrazy niepowtarzalne. Może to mieć pozytywny wpływ na ocenę Twojej strony.
Jeśli na takiej ocenie Google Ci zależy, masz dwie możliwości:
- Samodzielnie zrobić zdjęcie i je obrobić, albo coś namalować jeśli potrafisz (potem skan) tudzież przygotować własną wizualizację spędzając trochę czasu przy aplikacji graficznej. Nie każdy jednak to potrafi i nie każdy ma na to czas.
- Sedno tej publikacji. Możesz wykorzystać sztuczną inteligencję, powiedzieć jej co chcesz mieć na obrazku i poczekać chwilkę na wynik.
Tworzenie obrazów przez sztuczną inteligencję
Przy założeniu, że jesteśmy nietechniczni najprościej będzie skorzystać z interfejsów i aplikacji, których Twórcy wykorzystują API do komunikacji z zewnętrznymi silnikami AI takimi jak DALL-E, Stable-Diffusion, itp.., które wykonują dla nas “zleconą” im pracę.
Airbrush
Airbrush oferuje możliwość skorzystania z kilku algorytmów AI do generowania obrazów. Na ten sam prompt każdy algorytm będzie generował coś odmiennego, a więc dzięki tej różnorodności masz większe pole do popisu, a wszystko w ramach jednego rozwiązania.
Narzędzie pozwala generować grafiki o wielkości do 1024 x 1024px. Jest też upscaling. Upscaling’u można użyć już po wygenerowaniu obrazu, aby go powiększyć, co niekiedy jest konieczne, np. w sytuacji gdy chcesz umieścić taki obraz na pełną szerokość swojej strony.
Oto przykład obrazka wygenerowanego w Airbrush z wykorzystaniem silnika AI: Protogen
USP.ai
Oferuje wiekszą ilość algorytmów AI do wyboru i radzi sobie z nimi całkiem nieźle, odnoszę wrażenie że lepiej niż Airbrush. Obrazy w zależności od wybranej wersji silnika AI mają rozmiary 512 x 512 px i 768 x 768 px (idealny rozmiar to wstawienia obrazu w treści wpisu). Narzędzie do upscalingu również jest na pokładzie.
To narzędzie jak każde inne generuje obraz na podstawie promptów (poleceń), ale na mapie drogowej mignęła mi także opcja generowania obrazu z innego obrazu.
Dla osób początkujących przydatne są również przykłady promptów i generowanych na ich podstawie grafik. Dzięki temu szybciej załapiesz, to w jaki sposób przygotować polecenie żeby osiągnąć zamierzony efekt. Gotowego prompta możesz wykorzystać 1:1 lub z własnymi modyfikacjami i pozwolić sztucznej inteligencji działać ????
Oto kilka wygenerowanych widoków w USP.ai. Bardzo realistyczne.
USP.ai oferuje Ci także wtyczkę w repozytorium WordPress! Oznacza to integrację obu tych środowisk i możliwość generowania grafik bezpośrednio z poziomu panelu WordPressa.
Midjournej
Midjourney to przystań gdzie technologia i innowacja spotykają się z tradycją. Osobiście jestem wielkim fanem Midjourney, ponieważ oferuje to, co najlepsze w obu tych światach.
Aby skorzystać z tego rozwiązania konieczne jest konto na Discordzie, a dalej to jak rozmowa na czacie :) Wpisujesz prompty, a w odpowiedzi dostajesz grafiki :)
Masz tu znacznie wiekszą elastyczność dzięki dodatkowym argumentom takim jak chociażby proporcje obrazu, jakość i inne. bez problemu utworzysz obraz na podstawie innego, możesz np. wrzucić własną fotkę (autoportret) i stworzyć na jej podstawie dowolną postać. Postać wygenerowana na bazie mojego zdjęcia. Tak mogłbym wyglądać jako Wiking ????
To moje osobiste zdanie, ale uważam, że w momencie gdy piszę ten tekst nie ma silnika AI, który generowałby obrazy tak dobrej jakości jak robi to Midjourney. Przynajmniej jeśli mowa o silnikach, które przetestowałem, ale to dość spora liczba :)
Kilka przykładowych grafik stworzonych w Midjournej:
Wszystkie wymienione narzędzia tworzą grafiki od fotorealistycznych obrazów po totalne abstrakcje, a technologia jaka za nimi się kryje nie powiedziała jeszcze ostatniego słowa. To raptem początek. Z czasem obrazy na pewno będą znacznie lepsze, a sztuczna inteligencja dokładnie będzie odzwierciedlała to czego oczekujemy, dziś czynnik losowości jest jeszcze dość znaczący.
Efekt końcowy
Wykorzystanie AI do kreacji grafik to nie tylko sprytne użycie technologii, ale także sposób na prezentowanie naszych wizji, które potem możemy pokazać światu chociażby na własnej stronie WWW.
Sztuczna inteligencja jest naszym sojusznikiem, a nie konkurencją. Dzięki temu, mamy możliwość tworzenia czegoś unikalnego, co wyróżnia naszą stronę na tle innych. Jestem przekonany, że takie środowiska jak Midjourney to miejsca, gdzie każdy z nas może znaleźć inspirację i narzędzia do twórczego wykorzystania sztucznej inteligencji.
Najważniejsze są oczywiście wyniki, czyli efekt końcowy naszych działań. Te przede wszystkim zależeć będą od tego w jaki sposób opiszesz to co ma znaleźć się na obrazie. Powinieneś zrobić to w miarę precyzyjnie jeśli zależy Ci na czymś konkretnym. Im mniej konkretów podasz tym wiekszą swobodę dajesz sztucznej inteligencji. Z drugiej strony im więcej detali uwzględnisz w prompcie tym każdy z nich będzie miał mniejszą wagę. Odpowiednio konstruowane prompty to także rodzaj sztuki i wyzwanie przed jakim stajemy.
Ile to kosztuje
W zależności od Twoich potrzeb, a konkretnie od ilości generowanych grafik i ich jakości zależy czy wystarczy Ci wersja bezpłatna czy może trzeba siegnąć po wersję płatną. Warto mieć jednak świadomość, że wersje bezpłatne zazwyczaj pozwalają przetestować narzędzie, ale Ciężko będzie Ci rozwinąć skrzydła.
Modele rozliczeniowe są różne, np. dwa pierwsze rozwiązania oferują w danym pakiecie określoną ilość punktów zwanych kredytami. W zależności od tego jaki silnik AI do generowania obrazów wybierzesz jeden obraz może cię kosztować 1 kredyt lub więcej. Poniżej przykładowy cennik USP.ai z określoną pulą punktów (kredytów) w każdym planie.
Podobnie wygląda to w przypadku Airbrush, ale to dlatego że oba narzędzia są rodzajem agregatora różnych silników AI dla obrazów. W związku z tym twórcom tych rozwiązań łatwiej jest rozliczać się na bazie punktów (kredytów).
Inaczej wygląda to w przypadku Midjournej, gdzie płacisz za czas GPU, a darmowa wersja w zasadzie jest jedynie trialem, czyli planem do przetestowania. Po wyczerpaniu testowego czasu wykorzystania GPU, jeśli zechcesz dalej korzystać z narzędzia, konieczne będzie przejście na plan płatny zaczynający się od 10 dolarów miesięcznie.
Lifetime
Zdarzają się także oferty lifetime, tak jak w chwili gdy piszę ten tekst. Dwa pierwsze narzędzia Airbrush i USP.ai znajdziesz na Appsumo na atrakcyjnych warunkach – płacisz raz, a kredyty (punkty) będą się odnawiały każdego miesiąca bez stałych opłat. Sprawdź czy ta oferta jest jeszcze aktualna:
Kwestie prawne
Nie wszystkim podoba się fakt, że sztuczna inteligencja tak szybko radzi sobie z generowaniem grafik, które mogą wykorzystywać praktycznie dowolny styl ucząc się na pracach innych artystów.
Przykładowo na początku tego roku pozwy przeciwko Midjournej zostały zainicjowane przez troje ilustratorek: Sarah Andersen, Kelly McKernan i Karla Ortiz. Twierdzą one, że Midjournej, wraz z kilkoma innymi firmami tworzącymi narzędzia do generowania sztuki opartej na sztucznej inteligencji, naruszyły prawa “milionów artystów“, trenując swoje narzędzia naobrazach pobranych z internetu bez zgody ich twórców.
Czy te systemy naruszają prawo autorskie, jest skomplikowanym pytaniem, które jak twierdzą eksperci musi być rozstrzygnięte na drodze sądowej. Twórcy narzędzi do generowania sztuki opartej na sztucznej inteligencji zazwyczaj argumentują, że trening tego oprogramowania na danych chronionych prawem autorskim jest objęty doktryną fair use, ale przypadki związane z fair use nadal muszą być rozpatrywane przez sąd.
Pozew złożony przez kancelarię prawniczą Joseph Saveri Law Firm w imieniu ilustratorek został skrytykowany m.in. za techniczne nieścisłości. Na przykład, pozew zakłada, że modele sztuki oparte na sztucznej inteligencji “przechowują skompresowane kopie chronionych prawem autorskim obrazów używanych do treningu” i następnie je “rekomponują“; funkcjonując jako “narzędzia do tworzenia kolaży XXI wieku“. Jednak modele sztuki oparte na sztucznej inteligencji wcale nie przechowują obrazów, ale raczej matematyczne reprezentacje wzorców zebranych z tych obrazów. Oprogramowanie nie składa też kawałków obrazów w formie kolażu, ale tworzy obrazy od podstaw na podstawie matematycznych reprezentacji.
Firmy Stability AI, Midjourney i DeviantArt odpowiedziały na pozew, prosząc federalny sąd w San Francisco o jego oddalenie. Argumentują to tym, że obrazy generowane przez AI nie są podobne do prac artystów i że pozew nie wskazuje konkretnych obrazów, które rzekomo zostały niewłaściwie wykorzystane.
Ostatnio moja żona miała ciekawy przypadek. Po wygenerowaniu obrazu w Midjournej na bazie zdjęcia naszego kota, który następnie wrzuciła na jedną z grup FB spotkała się z krytyką jednej z czytelniczek, która z miejsca zarzuciła jej kradzież :) Nie była jednak w stanie wskazać przedmiotu zarzucanej kradzieży, ponieważ nie istnieją w sieci podobne obrazy. Z góry założyła, że jeśli coś jest stworzone przez AI jest niczym innym jak kradzieżą z czym nie mogę się zgodzić i chyba nikt rozsądnie myślący.
Owszem AI to technologia, która wymaga regulacji prawnych. Pracują nad nimi Stany Zjednoczone i Unia Europejska, ale to wciąż przed nami. Ciekawym przykładem jest jednak Japonia, która dała praktycznie w pełni zielone światło technologii AI.
W czerwcu 2023 roku rząd Japoński wydał jedne z pierwszych na świecie wytyczne prawne dotyczące generatywnej sztucznej inteligencji, w tym narzędzi takich jak Midjourney i Stable Diffusion. Najważniejszym pytaniem, na które wytyczne starały się odpowiedzieć, była kwestia praw autorskich do produktów generowanych przez narzędzia AI, ponieważ tworzone są one na podstawie ogromnych baz danych, które zawierają także materiały objęte prawem autorskim.
Obecne wytyczne zwiększają ochronę dla tych, którzy używają dzieł objętych prawem autorskim z internetu do szkolenia swoich modeli AI. Jednocześnie, nowe zasady oferują ograniczone środki dla poszkodowanych artystów, aby mogli dochodzić swoich praw przeciwko tym, których uważają za naśladowców.
Zgodnie z nowymi wytycznymi Japonii, artysta, który czuje się poszkodowany, będzie musiał udowodnić, że komercyjnie sprzedawane, wygenerowane przez AI dzieło sztuki ma “podobieństwo” do jego własnego dzieła. Możliwe jest udowodnienie, że praca “opiera się na istniejącym obrazie”, ale ponieważ zestawy danych treningowych nie są publicznie dostępne, artysta może nie mieć wiedzy o jego użyciu, a tym bardziej zdolności do zabezpieczenia dowodów.
I tak można przejść z jednej skrajności gdzie wszystko co robi AI określimy złodziejstwem, a tych którzy z AI korzystają złodziejami, w drugą, gdzie przeciętny artysta praktycznie nie ma nic do powiedzenia.
Podsumowanie
Na tym kończymy naszą krótką podróż do świata, w którym AI staje się artystą na potrzeby Twoich stron internetowych i nie tylko. Będę na ten temat jeszcze wielokrotnie pisał i prezentował tę technologię na kursach. Niezależnie od tego, czy jesteś sceptykiem, entuzjastą technologii, czy po prostu ciekawskim duchem, musisz przyznać, że to, co AI potrafi zrobić dzisiaj, przekracza granice naszej wyobraźni. Stworzenie obrazu, który potrafi poruszyć, zaintrygować, a nawet zaskoczyć – to nie jest już domena wyłącznie artystów z krwi i kości :)
Ale uwaga, nie twierdzę, że AI zastępuje artystów! AI tworzy zupełnie nową przestrzeń dla sztuki, gdzie maszyny i ludzie mogą współtworzyć i odkrywać nieskończone możliwości wyrażania siebie. I to w tym wszystkim jest niesamowite!
Nie tak dawno problemem była unikalność zdjęć i grafik na stronach, ponieważ większość autorów korzystała z tych samych stocków. AI tworzy unikalne obrazy, co skutecznie eliminuje ten problem. Dziś większość obrazów ilustrujących to o czym piszę jest tworzona przez sztuczną inteligencję (poza zrzutami ekranów). Dzięki temu mam unikalne treści graficzne i przednio się przy tym bawię.
Świata sztucznej inteligencji nie da się zatrzymać, więc lepiej wskoczyć na ten pędzący pociąg i zobaczyć, dokąd Cię zabierze niż stawiać mu opór. Tak było z wiekszością rewolucyjnych zmian. Coś co kiedyś wydawało się okropne i nie do pomyślenia dziś jest zakorzenione w naszej codzienności i stało się naturalną częścią naszego życia. Rozwoju nie zatrzymamy, możemy go jedynie hamować i łudzić się, że wpłyniemy na zmianę jego kierunku, co i tak będzie tylko tymczasowe.