Wykorzystanie sztucznej inteligencji do ulepszania tła zdjęć produktów

Zdjęcie produktu perfum Armani/Prive pojawia się na tematycznym tle ze składnikami zapachowymi.

PhotoRobot prezentuje, jak zaprojektować podpowiedzi AI w celu wygenerowania niestandardowych teł zdjęć produktów dla obrazów przechwytywanych przez roboty.

Gdy sztuczna inteligencja wspiera prawdziwą fotografię produktową

Wykorzystanie sztucznej inteligencji do tworzenia tła zdjęć produktowych jest jednym ze sposobów na ulepszenie fotografii zrobionej przez robota PhotoRobot. Podczas gdy PhotoRobot jest w stanie automatycznie usunąć tło ze zdjęć produktów, narzędzia AI mogą zastąpić tła precyzyjnym stylem marki. Weźmy na przykład zastąpienie precyzyjnego usuwania tła PhotoRobot tłem, które wizualnie prezentuje reputację produktu. 

Może to być schemat kolorów, który uzupełnia samą markę, lub pełna scena 3D, w której znajduje się produkt. Tłem może być biały żyłkowany marmur, ciemnofioletowo-czerwony aksamit, rubinowo-czerwony jedwab lub inne luksusowe tekstury. Co więcej, niektóre tła produktów mogą ilustrować rzeczywiste składniki produktu, takie jak składniki specyficzne dla perfum .

W takim przypadku narzędzia sztucznej inteligencji mogą drastycznie zaoszczędzić czas na pozyskiwanie i agregowanie wszystkich istotnych informacji o produkcie – zwłaszcza jeśli nie są one pod ręką. Zespoły mogą następnie wykorzystać te informacje podczas projektowania podpowiedzi obrazu AI w celu wygenerowania tła specyficznego dla marki i produktu. Dlaczego nie przekonać się o tym poniżej? Dowiedz się, w jaki sposób studia oparte na PhotoRobot wykorzystują narzędzia sztucznej inteligencji do ulepszania tła produktów i włączania ich do przepływów pracy produkcji studyjnej.

Cel pozostaje: wysokiej jakości zdjęcia produktów

Tworzenie świetnych zdjęć produktów w krótszym czasie i przy mniejszym wysiłku pozostaje kamieniem węgielnym misji PhotoRobot. Dzieje się tak nawet wtedy, gdy sztuczna inteligencja może tworzyć fotorealistyczne obrazy produktów wyłącznie na podstawie podpowiedzi tekstowych. Punktem wyjścia pozostaje prawdziwe, wysokiej jakości zdjęcie produktowe. Sztuczna inteligencja może wtedy wzbogacić otaczającą go historię. 

W ten sposób postępy w nowoczesnej sztucznej inteligencji tylko rozszerzają zestaw narzędzi PhotoRobot. Technologia ta płynnie integruje się również ze zautomatyzowanymi przepływami pracy fotograficznej. Dzięki zaawansowanej inżynierii podpowiedzi sztuczna inteligencja może przyspieszyć przepływ produktów w studiu i poprawić rzeczywiste obrazy produktów, które przechwytujemy za pomocą robota. Zrobotyzowane przechwytywanie zapewnia wysoką jakość niezbędną do tworzenia zdjęć produktów. Działa również do tworzenia zdjęć, które są bardziej kompatybilne z narzędziami do generowania obrazów.

Przykładowe zdjęcia produktów z czystym białym tłem prezentują gamę PhotoRobot.

Na przykład użycie oświetlenia LED o niskim CRI pozwala uzyskać zdjęcia, na których brakuje części spektrum kolorów. Prowadzi to do krytycznych problemów z generatorami obrazów AI, które nie są w stanie odtworzyć tego, czego tam nie ma. Jednak PhotoRobot zapewnia doskonałe oświetlenie, usuwanie tła i przetwarzanie końcowe zdjęć, aby wydajnie działać przez sztuczną inteligencję. Uzyskane obrazy są następnie optymalne do dodatkowych ulepszeń, takich jak zamiana tła lub pełna inżynieria scen 3D.

A co ze zdjęciami produktów w pełni generowanymi przez sztuczną inteligencję?

Po co w ogóle robić prawdziwe zdjęcia, skoro sztuczna inteligencja może wygenerować zdjęcia produktów? Jasne, w przypadku niektórych działań marketingowych prawdziwe zdjęcia nie zawsze są konieczne. Jednak głębsza analiza obrazów generowanych przez sztuczną inteligencję często ujawnia wady. Dlatego są one przydatne tylko w ograniczonych zastosowaniach. 

Najczęstszymi problemami, które występują ze zdjęciami produktów AI, są dziwna typografia i drobne błędy szczegółów. Nie jest tak źle, jak widok dłoni z sześcioma palcami, ale nadal zauważalny. 

Sztuczna inteligencja często zniekształca wymiary, nie spełniając oczekiwań dotyczących jakości, a czasem nie dopasowując reklam do rzeczywistych towarów. Może to budzić obawy zarówno etyczne, jak i prawne, co przemawia za utrzymaniem inwestycji w prawdziwą fotografię produktową.

Jak ważne jest tło produktu

Dla wielu firm odpowiednie pozostaje tworzenie zdjęć produktów na czystym białym tle lub przezroczystym tle. W rzeczywistości większość klientów PhotoRobot wymaga jedynie jego precyzyjnego usunięcia tła.

Jednak niektóre linie produktów wymagają po prostu wyższej jakości zdjęć produktów. Pomyśl o markach designerskich i luksusowych o wyjątkowej reputacji – Armani, Apple, Louis Vuitton, Rolex. Firmy takie jak te będą potrzebowały profesjonalnych zdjęć do druku w czasopismach i reklamy na billboardach. To, a także obrazy do reklam online i stron produktów. We wszystkich przypadkach element musi pozostać w centrum ostrości na zdjęciach. Jednak tło może również pełnić funkcję zwrócenia uwagi na reklamę i odróżnienia produktu od konkurencji. 

Tło może pasować do schematu kolorów samej marki lub podkreślać materiał, fakturę i projekt przedmiotu. Weźmy na przykład dodanie cieni do tła, aby rozświetlić srebro, złoto i inne jasne lub odblaskowe produkty. Takie tła są często popularne na zdjęciach designerskich zegarków na rękę, okularów przeciwsłonecznych, kolekcji biżuterii i innych towarów luksusowych. Chociaż głównym celem tła pozostaje uzupełnienie przedmiotu, a nie odwracanie od niego uwagi.

Kiedy autentyczność jest kluczem do prezentacji produktu

W większości przypadków celem zdjęć produktów jest przeniesienie rzeczywistego obiektu do świata cyfrowego. Jednocześnie obiekt powinien pozostać realistyczny, pouczający i przyciągający wzrok.

Duże marki często robią to, inwestując w wysoce zaawansowane modele produktów 3D i potoki renderowania modeli 3D. W ten sposób zasoby stają się bardziej wciągające, a elementy można również łatwo umieścić na dowolnym tle produktu. Wizualizacja 3D pozwala również firmom zademonstrować wymienne, ruchome lub interaktywne konfiguracje produktów. Weźmy na przykład wbudowane modele 3D PhotoRobot używane z platformami hostingowymi modeli 3D, takimi jak nasza długoletnia Emersya. 

Mimo to wprawne oczy potrafią odróżnić prawdziwą fotografię od renderingu 3D. To samo dotyczy obrazów całkowicie generowanych przez sztuczną inteligencję. Po prostu brakuje autentyczności, czasami w różnych aspektach, które ludzkie oko łatwo dostrzega. W niektórych przypadkach ogranicza to rentowność. Nie oznacza to jednak, że rendery 3D i generowanie obrazów AI nie mają miejsca w fotografii produktowej.

Dlaczego zautomatyzowana fotografia pozostaje standardem

W PhotoRobot cele pozostają takie same – autentyczne zdjęcia z szybszymi, prostszymi i bardziej skalowalnymi procesami produkcyjnymi.

Zautomatyzowane przepływy pracy PhotoRobot obsługują siedem etapów produkcji od spożycia do zwrotu produktu.

  • Tysiące zdjęć na godzinę
  • Najwyższa jakość obrazu
  • Światowej klasy automatyzacja fotografii produktowej
  • W pełni automatyczna postprodukcja
  • Perfekcyjne i precyzyjne usuwanie tła
  • Natychmiastowa publikacja lub dostawa przez API

Pomimo szybkiego postępu w generatorach obrazów AI, PhotoRobot pozostaje szybszym i bardziej niezawodnym rozwiązaniem, o większym zwrocie z inwestycji. Nie ma obaw co do spójności ani jakości wyników, a wiarygodność i wierność są gwarancją.

Tam, gdzie sztuczna inteligencja błyszczy w przepływach pracy PhotoRobot

Podczas korzystania ze sztucznej inteligencji w przepływach pracy opartych na PhotoRobot istnieje wiele obszarów, w których sztuczna inteligencja przoduje. 

  • Automatyczne katalogowanie (pobieranie nazw produktów, kodów produktów i ustrukturyzowanych metadanych)
  • Zastępowanie tła (umieszczanie elementów na marmurze, aksamicie lub innych teksturach)
  • Tematyczne opowiadanie historii wizualnej (np. ilustrowanie składników perfum wraz z ich butelką)

Na przykład jednym z przypadków użycia może być sfotografowanie kolekcji perfum dla klienta. Wyobraźmy sobie jednak, że studio ma pod ręką tylko produkty, z ograniczonymi informacjami o produktach. Dzieje się tak, gdy podpowiedzi AI mogą łatwo pobierać odpowiednie dane, automatycznie je katalogować i dostarczać ustrukturyzowane metadane dotyczące elementów. 

Studia mogą następnie dołączyć dane do obrazów klienta i wykorzystać te informacje podczas zastępowania precyzyjnego usuwania tła przez PhotoRobot. Może to być stworzenie tła, które jest bardziej reprezentatywne dla marki klienta lub produktu ze względu na jego reputację.

Packshot przedstawiający czarno-złotą butelkę perfum ma tło z pasującymi ciemnymi kolorami i motywem.
Zdjęcie flakonu perfum wraz z opakowaniem leży na stole, na którym odbijają się części przedmiotów.
Perfumy Armani stoją na marmurowym stole z tłem pasującym do jego wyglądu i stylu życia.

Studium przypadku PhotoRobot: Fotografowanie perfum

Dla demonstracji, poniżej znajduje się rzeczywiste studium przypadku fotografujące serię perfum Armani Privé w PhotoRobot Studio. Rzeczywisty flakon perfum jest dostępny w studio, ale nie ma szczegółowych metadanych dotyczących produktu.

W takim przypadku monit sztucznej inteligencji może zagregować odpowiednie informacje o produkcie w ustrukturyzowany zestaw danych do przeglądu. Co więcej, możliwe jest pobranie danych o każdym elemencie z całej kolekcji zapachów. 

Monit może pobrać nazwę zapachu, nazwę kolekcji i kod EAN dla każdego przedmiotu. Następnie może zawierać instrukcje tworzenia danych w dwóch formatach, na przykład: zwykłego pliku TXT i ustrukturyzowanej tabeli CSV.

Podpowiedź 1: Pobierz listę produktów

Aby pobrać listę produktów, najpierw podpowiadamy AI, opisując projekt. Monit powinien następnie określać informacje do pobrania i sposób formatowania wyników. (Uwaga: Poniższy przykładowy inżynieria podpowiedzi AI i rzeczywiste wyniki pochodzą z maja 2025 r. Należy pamiętać, że wydajność będzie się różnić na różnych platformach i w miarę rozwoju technologii wraz z przepływami pracy PhotoRobot).

Monit "pobierz listę produktów":

Tworzę ustrukturyzowany zbiór danych perfum do wykorzystania w środowisku fotografii produktowej i automatyzacji AI.

Prosimy o wygenerowanie pełnego przeglądu kolekcji perfum linii perfum Armani Privé, pogrupowanego według kolekcji (np. Les Eaux, La Collection, Les Terres Précieuses, Les Mille et Une Nuits, Kogane Collection itp.).

Do każdych perfum podaj:

1. Nazwa zapachu

2. Nazwa kolekcji

3. Kod EAN – międzynarodowy kod kreskowy dla standardowej butelki o pojemności 100 ml

Wynik można wyświetlić w dwóch formatach:

- Zwykła, czytelna lista plików TXT pogrupowana według kolekcji (w celach informacyjnych).

- Ustrukturyzowana tabela CSV z kolumnami: Kolekcja, Zapach, EAN.

- Przygotuj pliki do bezpośredniego pobrania.


Uwzględnij tylko perfumy, które istnieją w oficjalnej linii Armani Privé. Jeśli dla danego zapachu istnieje wiele kodów EAN, należy podać standardową wersję 100 ml (lub najbliższą dostępną).

Nie używaj marketingowego języka ani opisów – używaj tylko ustrukturyzowanych, rzeczowych danych.

Wyjście 1: Lista perfum Armani

Powyższy monit zawiera zarówno zwykły plik TXT, jak i ustrukturyzowaną tabelę CSV. Zawiera uporządkowany przegląd całej kolekcji perfum, z nazwami, grupami i kodami EAN:

Tabela CSV zawiera uporządkowany przegląd całej kolekcji perfum wraz z informacjami o produkcie.

Oszczędza to wiele godzin ręcznej pracy w studiu. To lub niepotrzebna wymiana zdań, a czasem opóźniona komunikacja między studiem a klientem lub dostawcą.

PhotoRobot - Integracja z API PhotoRoom

Po zrobieniu zdjęć za pomocą PhotoRobot – z czystym tłem i optymalnym oświetleniem – możliwe jest ich dalsze ulepszenie za pomocą sztucznej inteligencji. W tym celu PhotoRobot bezproblemowo integruje PhotoRoom za pośrednictwem API z systemem sterowania PhotoRobot. Pozwala to na:

  • Automatyczne usuwanie tła,
  • Dodawanie naturalnie wyglądających cieni,
  • Zamiana czystego białego tła na luksusowe powierzchnie (marmur, aksamit, drewno).

Bois D'Encens by Armani/Prive w czarno-złotej butelce znajduje się na marmurze na dopasowanym tle.
Packshot prezentuje czarno-złote perfumy Armani / Prive na marmurowym stole w dobrze oświetlonym pomieszczeniu.
Packshot perfum Armani / Prive i ich opakowania pojawia się na białym marmurowym stole z kwiatami.

Wizualne opowiadanie historii za pomocą tła produktów

Idąc o krok dalej, wizualne opowiadanie historii jest możliwe dzięki tłucznemu produktowi na wiele sposobów, w których sztuczna inteligencja może pomóc. Weźmy na przykład wizualizację kluczowych składników zapachowych wokół każdej butelki perfum.

Bois D'Encens marki Armani/Prive pojawia się ze składnikami zapachowymi w tle i na pierwszym planie.
Tło składników zapachowych uzupełnia zdjęcie produktu Bois D'Encens autorstwa Armani/Prive.
Składniki zapachowe i naturalne kolory dzielą się historią produktu na obrazie w tle.

Podpowiedź 2: Znajdź składniki, które można zwizualizować

Znalezienie możliwych do wizualizacji składników specyficznych dla każdych perfum wymaga bardziej opisowej podpowiedzi AI. Monit musi prosić o wyniki, aby zawierały kluczowe notatki, motywy wizualne i elementy projektu dla każdego elementu. Te informacje pomogą w późniejszym monitowaniu inżynierów w celu wygenerowania obrazów tła, które są zgodne z marką i produktem. 

Weźmy na przykład następujący monit. Zaczynamy od opisania projektu i załączenia wyjściowego pliku CSV z pierwszego monitu.

I am preparing a detailed dataset for building a mood board or artistic representation. The dataset must provide structured data to generate visual representations of perfumes using AI. Please provide a detailed CSV table for the perfumes in the following file:

- 2_armani_prive_overview_ean.csv (the output from prompt 1)


Select perfumes only in the dataset:

- La Collection


For each perfume, create the following columns:

1. Fragrance – The name of the perfume

2. Top Notes – Tangible, visualizable ingredients (e.g. flowers, resins, peels)

3. Heart Notes – Tangible, visualizable ingredients

4. Base Notes – Tangible, visualizable ingredients

5. Visual Themes – A short phrase describing the atmosphere and textures the perfume evokes (for artistic use, e.g. “stone walls, golden light”)

6. Bottle Design – A detailed description of the perfume bottle: color and material of the body, shape, color of the cap, and label

Also, keep all ingredients and design details clearly worded for use in image generation. Take for example: resins, woods, herbs, spices, flowers, fruits, leaves, roots, smoke, or textures – e.g., dry, mineral, creamy. Exclude abstract terms like “elegant”, “sophisticated”, or “sensual”. Focus on concrete visual elements like “black glass”, “gold plate label”, “ivory stone cap”, etc.

Additionally, briefly list the main visual themes or textures the perfume evokes (e.g. "golden glow", "stone walls", "church incense", "earthy forest", etc.) — anything useful for background styling or setting a graphic mood.

Prepare a CSV structure that will later be used to generate visual prompts for AI image models like DALL·E. Please format the output clearly and in full.

Dane wyjściowe 2: Plik CSV z wizualizowaną tabelą składników

Powyższy monit skutkuje szczegółową tabelą składników do specyfikacji w formacie pliku CSV.

Uporządkowana tabela CSV zawiera szczegółową listę składników dla każdego zapachu perfum.

Na przykład wyniki monitu obejmują następujące informacje dotyczące pierwszych perfum.

  • Kolekcja: La Collection
  • Zapach: Bois d'Encens
  • Kod kreskowy: 3605520754163
  • Nuty głowy: Żywica kadzidła dymnego; Ziarna czarnego pieprzu
  • Nuty serca: Suche wióry cedrowe; Korzenie wetiwerii
  • Nuty bazy: Liście paczuli; Tlący się dym mineralny
  • Motywy wizualne: Kamienne mury, wznoszące się kadzidła, zwęglone drewno, cisza o zmierzchu
  • Projekt butelki: szklana butelka z czarną lakierowaną kamienną nakrętką i złotą etykietą

Drugie perfumy mają wtedy swoje własne rezultaty, które są specyficzne dla danego produktu.

  • Kolekcja: La Collection
  • Zapach: Pierre de Lune
  • Kod kreskowy: 3605520754170
  • Nuty głowy: Sproszkowany korzeń irysa; Zmiażdżone fioletowe płatki
  • Nuty serca: Białe kwiaty heliotropu; Miękkie białe piżmo
  • Nuty bazy: Zamsz w kolorze kości słoniowej; Lekka esencja migdałowa
  • Motywy wizualne: Odbicia światła księżyca, fioletowy połysk, jedwabiste płatki, półprzezroczysty blask
  • Projekt butelki: szklana butelka z nakrętką z kamienia kości słoniowej i złotą etykietą

Te uporządkowane dane o wszystkich perfumach w kolekcji dostarczą informacji niezbędnych do rozpoczęcia tworzenia podpowiedzi wizualnych.

Monit 3: Wygeneruj kolumnę CSV "Wizualny monit"

Kolejnym etapem, który można zobrazować, jest opracowanie wizualnych podpowiedzi dla generatorów obrazów. W tym celu sztuczna inteligencja podpowiadająca może wygenerować nową kolumnę "Podpowiedź wizualna" dla każdego innego perfumy w pliku CSV. Wymaga to jednak bardzo szczegółowych instrukcji w nowym monicie. Zaczyna się to najpierw od przesłania wizualizowalnej listy składników, a następnie opisania projektu. Monit musi następnie zawierać wiele warstw określonych poleceń. Polecenia obejmują wymagania dotyczące monitów, typowe błędy, których należy unikać, ograniczenia, takie jak typografia i dane wyjściowe, a także oczekiwania dotyczące jakości.

Opisz projekt i materiały

Pierwsza warstwa monitu dołącza plik CSV do analizy i zawiera ogólne instrukcje dotyczące zadania.

Otrzymasz plik CSV zawierający uporządkowane dane o perfumach z kolekcji Armani Privé La. Każdy wiersz zawiera:

- Zapach (nazwa perfum)

- Nuty głowy (wyraźnie widoczne składniki)

- Nuty serca (wyraźnie zwizualizowane składniki)

- Nuty bazy (wyraźnie zwizualizowane składniki)

- Motywy wizualne (atmosfera i tekstury, które przywołują perfumy)

- Projekt butelki (materiał, kolor, kształt, etykieta i nakrętka)

- EAN (używany jako nazwa pliku obrazu)

Twoim zadaniem jest wygenerowanie nowej kolumny o nazwie "Podpowiedź wizualna", która zawiera pełny i bezpośredni monit dotyczący narzędzi do generowania obrazów AI (np. DALL· E lub Midjourney).

Definiowanie nowych wymagań dotyczących kolumn

Druga warstwa monitu identyfikuje wymagania dla każdego nowego elementu w nowej kolumnie pliku CSV.

Każdy monit powinien opisywać, jak przekształcić zdjęcie produktu perfum (o nazwie {EAN}.jpg) w ostateczny obraz o następujących właściwościach:
  • Flakon perfum powinien pozostać centralną kotwicą wizualną.
  • Zastąp tło luksusową sceną artystyczną, która:
    • Zawiera eleganckie przedstawienia wymienionych składników (nuty głowy, serca, bazy).
    • Dopasowuje paletę kolorów i oświetlenie do designu butelki.
    • Obejmuje motywy wizualne (tekstury, nastroje, otoczenie).
    • Dodaje elementy pierwszego planu, takie jak dym lub mgła, jeśli są wymienione wśród składników.
    • Zachowuje oryginalną perspektywę i kąt kamery.

Określ ograniczenia i typowe błędy, których należy unikać

Po trzecie, monit  wymienia konkretne ograniczenia i typowe błędy, których należy unikać.

Nie podawaj pliku CSV ani nie opisuj struktury. Napisz każdą podpowiedź tak, jakby zwracała się bezpośrednio do sztucznej inteligencji, aby wygenerować obraz dla tych perfum.

Rezultat powinien wydawać się premium, klimatyczny i wierny tożsamości zapachowej. Powinien być nie do odróżnienia od profesjonalnie wyretuszowanego zdjęcia redakcyjnego, ale w pełni wygenerowany przez sztuczną inteligencję. Widz nie powinien być w stanie stwierdzić, że obraz jest syntetyczny.

Nie wspominaj też ani nie pokazuj sztucznego generowania. Obraz musi wyglądać autentycznie i fotorealistycznie.

Określanie wymagań dotyczących projektowania etykiet i typografii

Czwarta część monitu zawiera instrukcje dotyczące pracy z tymi konkretnymi butelkami perfum. Typografia jest częstym problemem dla sztucznej inteligencji, dlatego ważne jest, aby zapewnić bardzo jasne instrukcje dotyczące projektów etykiet, brandingu i stylizacji.

Pay special attention to the design of the front label on the bottle and its graphics accuracy. The gold plate must include the following exact text, as the original image, centered and aligned as on the real product.

- The slash symbol (" / ") between ARMANI and PRIVĒ is slightly taller than other letters and subtly stylized. It starts slightly below other characters, and ends slightly above the other characters, as on the original image.  

- The character "Ē" in PRIVĒ must have a clearly visible horizontal accent mark, while the letter including the accent mark is the same height as other letters. There is a flat horizontal line above it (not an acute line). The line must be the same width as the E below it, not slanted. It must not resemble an É. This is not a diacritic or an accent – it is a flat macron (horizontal bar).  In other words, the horizontal line on Ē must resemble a short flat line, like a hyphen, placed precisely above the E. It must not be diagonal like in É.

- Match the exact label design from the reference product photo.

- The label must be identical in typography, spacing, and accents. The label must be the same visual style as the original image, as it is crucial to the brand identity.  

- The typography must be accurate and not estimated or replaced. Caution: the typography may be changed for a single character, so follow the details for each character individually.  

- Do not change, shorten, or paraphrase any part of the label.

Opisz końcowe oczekiwania

Ostatnia warstwa monitu kontynuuje oczekiwania dotyczące każdego monitu wizualnego i zawiera instrukcje dotyczące nowego pliku CSV.

Talerz butelki musi zachować swoje proporcje, wykończenie powierzchni i wytłoczony nadruk w miękkim oświetleniu.

Ta etykieta ma kluczowe znaczenie dla marki – traktuj ją z taką samą wiernością wizualną, jak logo lub znak towarowy.

Kształt butelki ma kluczowe znaczenie dla marki – traktuj go z taką samą wiernością wizualną, jak logo lub znak towarowy.

Nie zmieniaj tekstu ani nie zmieniaj czcionki w przybliżeniu – traktuj tę etykietę jako krytyczny dla marki element projektu, który musi być dokładny i ostry.

Etykieta musi zachować swoje realistyczne proporcje, fakturę i złote wykończenie – jest lekko wytłoczona z miękkim satynowym połyskiem w miękkim świetle.

Zapisz wynik w nowym pliku CSV ze wszystkimi oryginalnymi kolumnami oraz nową kolumną "Podpowiedź wizualna".

Dane wyjściowe 3: Kolumna CSV "Podpowiedź wizualna"

Na końcu wynikowa tabela CSV zawiera pełną listę perfum, nazw, kodów EAN, składników do wizualizacji i podpowiedzi wizualnych. Podpowiedzi wizualne zawierają pełne i bezpośrednie podpowiedzi dotyczące narzędzi do generowania obrazów AI, takich jak DALL· E i Midjourney. Pomogą one stworzyć niestandardowe tła i sceny, które twórczo uzupełnią prawdziwe zdjęcia flakonów perfum.

Podpowiedzi wizualne zawierają pełne i bezpośrednie podpowiedzi dla generatorów obrazów AI, takich jak DALL· E i Midjourney.

Niestandardowe renderowanie tła z podpowiedzi wizualnych

Po utworzeniu podpowiedzi wizualnych dla każdego elementu, Twój ulubiony generator obrazów AI może zrobić resztę. Wszystko, czego wymaga, to przesłanie obrazów przechwyconych przez PhotoRobot i wprowadzenie wizualnych podpowiedzi z pliku CSV w celu utworzenia niestandardowych teł. Generator wyrenderuje tło zgodnie z podpowiedzią inżynieryjną i do renderowania w różnych stylach.

Tymczasem obrazy produktów PhotoRobot z precyzyjnym usuwaniem tła ułatwiają zamianę tła i wyjmowanie. Jeśli któryś z nich nie pasuje idealnie, zespoły ds. zapewnienia jakości mogą szybko stworzyć taki, który działa. To lub poproś generator AI, aby dostosował dane wyjściowe, aż będą zadowalające.

Naturalne kolory drewna i składniki perfum wzbogacają tło produktu i pasują do produktu.
Kompozycja ziemistych składników otacza produkt z smugą dymu w tle.
Smużka dymu unosi się nad produktem na tle ukazującym naturalne składniki perfum.

Pełne renderowanie sceny tła 3D

Wreszcie, jeśli przesuwasz granice generowania tła AI, możliwe jest nawet pełne renderowanie scen 3D. Wykracza to jednak daleko poza prostsze zamianę tła. Wyobraź sobie, że wyświetlasz fantastyczne środowisko 3D z dokładną scenerią oprócz kluczowych składników. Osiągnięcie tego celu wymaga znacznie ambitniejszego podpowiedzi.

Podpowiedź 4: Renderuj scenę 3D w tle

Aby wygenerować pełną scenę 3D dla jednej z flakonów perfum, niezbędna jest kolejna wyrafinowana podpowiedź. Musi uwzględniać kompozycję sceny, motywy wizualne, elementy atmosferyczne, palety kolorów, oświetlenie i nie tylko. Weźmy na przykład następujący monit.

Opisz całą scenę w tle

Po przesłaniu obrazu produktu do sztucznej inteligencji uruchom monit generatora, wyświetlając listę wszystkich wymagań dotyczących sceny w tle. Będzie to obejmować informacje o produkcie z wizualizowanej listy składników i podpowiedzi wizualne.

Wygeneruj całą scenę, w tym tło, składniki, tekstury i artystyczne oświetlenie w harmonii z projektem butelki.

Kompozycja sceny:

Zbuduj eleganckie środowisko w stylu redakcyjnym wokół butelki, używając:
  • Wizualne reprezentacje następujących składników:
    • Nuty głowy: żywica kadzidłowca dymnego; Ziarna czarnego pieprzu
    • Nuty serca: Suche wióry cedrowe; Korzenie wetiwerii
    • Nuty bazy: liście paczuli; Tlący się dym mineralny
  • Motywy wizualne, które wyrażają atmosferę zapachu:
    • Kamienne mury, wznoszące się kadzidła, zwęglone drewno, cisza o zmierzchu
  • Paleta kolorów i oświetlenie pasujące do rzeczywistego produktu:
    • szklana butelka z czarną lakierowaną kamienną nakrętką i złotą etykietą
Dodaj atmosferyczne efekty pierwszego planu, takie jak dym lub mgła, jeśli są częścią nut, częściowo nakładając butelkę na realizm, aby uzyskać realizm. Zachowaj wizualną równowagę, głębię i wyrafinowanie.

Zachowaj skierowaną do przodu, studyjną perspektywę i kąt kamery.

Określanie krytycznych instrukcji dotyczących wyglądu etykiety

Następnie należy określić kluczowe instrukcje dotyczące dokładności graficznej etykiety i butelki. Są to te same polecenia, co w wizualnych monitach dotyczących wyglądu każdego pojedynczego elementu. Instrukcje dotyczą dokładności typografii, projektu etykiety, grafiki i oryginalnego wykorzystania zdjęć. 

Dołącz ostateczną specyfikację obrazu

Na koniec poinformuj SI o wszystkie ostateczne wymagania dotyczące obrazu z wizualnego monitu pojedynczego elementu. Obejmuje to kopiowanie tych samych instrukcji, co wcześniej, dotyczących proporcji, wykończeń, wytłaczanego nadruku i oświetlenia. Zawierają one szczegółowe wymagania jakościowe dotyczące etykiety, kształtu butelki, tekstu, typografii i dodatkowych elementów projektu. Ostatecznie ostateczny wynik powinien przybrać kształt pełnej sceny 3D za elementem, który pozostaje w centrum ostrości.

Wyjście 4: Scena tła generowana przez sztuczną inteligencję

Oceń samodzielnie powstałą scenę 3D jako tło produktu perfum.

Prawdziwe zdjęcie Bois D'Encens autorstwa Armani/Prive staje się obrazem produktu i tłem wygenerowanym przez sztuczną inteligencję.

Nuta: W takim przypadku nie ma sposobu, aby w pełni zintegrować prawdziwe zdjęcie ze światem 3D. Konieczne jest, aby generator AI zamiast tego przemalował przedmiot cyfrowo, aby umieścić go w scenie 3D. W tym przypadku istnieją różne ograniczenia, takie jak brak prawdziwej kompozycji wielowarstwowej, jak w Photoshopie. Pozostają również problemy typograficzne ze złożonymi znakami. Niemniej jednak takie problemy nie zawsze będą się utrzymywać i mogą rozwiązać się raczej wcześniej niż później wraz z postępem technologicznym.

PhotoRobot - Połączenie prawdziwej zautomatyzowanej fotografii i sztucznej inteligencji

Zasadniczo połączenie zautomatyzowanej fotografii i narzędzi sztucznej inteligencji może znacznie wzbogacić doświadczenia klientów w całym portfolio. Chociaż fundament pozostaje prawdziwą fotografią wysokiej jakości, sztuczna inteligencja może rozszerzyć narrację wokół niej. Technologia obsługuje wizualizację tematyczną i może służyć do znacznego przyspieszenia przepływu pracy w studiu fotograficznym. Umożliwia szybkie pozyskiwanie i syntezę informacji, automatyczne katalogowanie i efektywną wymianę tła (z wiedzą na temat inżynierii podpowiedzi). Aby dowiedzieć się więcej, zespół PhotoRobot jest zawsze gotowy, aby pomóc firmom w realizacji ich kreatywnej wizji. Po prostu zapytaj, jak możemy pomóc. Twój projekt może nawet pojawić się w przyszłych wpisach na blogu - jeśli oczywiście nie będzie to ściśle strzeżony tajny przepływ pracy!