AI-generated versions of Mona Lisa

Vi behöver tala om ditt (AI-) innehåll!

Under de senaste åren har artificiell intelligens tagit stora steg när det gäller att själv kunna skapa digitalt content. Detta är tack vare framsteg inom "natural language processing" som är den del inom AI-forskningen som arbetar med att förstå och generera mänskligt språk. Det finns nu många användningsområden för den här teknologin, från chatbottar som kan föra ett samtal med en människa, till system som kan generera nyhetsartiklar eller till och med poesi. I den här artikeln ska vi utforska hur AI kan skapa content och hur teknologin kan komma att appliceras.

OK, låt oss pausa där. Har du några åsikter om introduktionen till artikeln? Tråkig, för neutral, bra – eller till och med felaktig? Ja, eftersom den var skriven av AI-algoritmen GPT-3 från OpenAI får du skicka din feedback till Elon Musk snarare än mig. Och vid det här laget har du sannolikt förstått vart jag vill komma med rubriken “We need to talk about your (AI) content”. För content, och hur det produceras, kommer sannolikt fundamentalt förändras inom en nära framtid.

Dammluckorna, för automatiserat och AI-genererat innehåll, har öppnats och du kommer sannolikt att upptäcka att du inte har råd att stå vid sidan. Och det är så klart okej, men utan att sätta en tydlig kvalitetsstandard som grund kan det sluta med att du bara blir ytterligare en bidragsgivare till den evigt ökande volymen av skräp som fyller Internet.

Varje dag laddas enorma volymer data upp till den vildmark vi kallar Internet. Utbudet av allt från samhällskritiska tjänster, till kattvideos och SEO-optimerade klickfarmar flödar över. För skojs skulle försökte jag ta reda på hur mycket innehåll som finns på nätet idag. Det närmaste jag kom till ett faktiskt svar var 2.5 kvintiljoner bytes (Jag har inte har den blekaste hur mycket det är, men tror det är "mycket.") En mer greppbar siffra är 90%. Som i hur mycket den totala mängden av allt innehåll på Internet som skapats under de två senaste åren. Yikes!

Och visst, medan cyniskt, systematiskt missbruk från aktörer som är ute efter att tjäna sina egna syften kan få oss att tänka på Internet som ett träsk så är fortfarande det mesta innehållet där ute till för att informera, utbilda och underhålla oss. Samtidigt är det Internets otämjda natur som fortfarande gör det till en så spännande plats att utforska och utveckla.

Nyckelordet för content har alltid varit "kvantitet". Det har alltid handlat om hur ofta du kan publicera, och hur mycket innehåll du kan skapa till dina produktsidor, din blogg eller liknande för att uppnå en god SEO. Missförstå mig inte, jag vet att sökmotoralgoritmer i hög grad premierar kvantitet och att du inte kan förvänta dig vara synlig någonstans så länge du inte skapar stora mängder content.

Men hur kan den logiken, att den som skapar mest innehåll syns mest, upprätthållas i en framtid där content kan produceras automatiskt, av sig själv? Hur kan kvantitet vara en faktor för synlighet när allt du behöver göra för att skapa mer innehåll än du någonsin kan komma att behöva är att trycka på en knapp? 

Tja, självklart har Google och andra med dem identifierat den här risken. Google är, trots allt, en av de ledande aktörerna inom AI och vet bättre än någon annan vad det här kan betyda. Deras algoritm har redan förändrats för att premiera innehåll som är vad de kall EAT och YMYL. Eller på enkel svenska – kvalitetsinnehåll. Och innehållsproducenter måste också förändras i takt med utvecklingen – precis som verktyg för att producera ändlösa mängder content dyker upp så ökar också kvalitetskraven.

Så här långt har vi bara talat om content i form av text, men det finns många fler användningsområden inom content där AI kan komma att få stort inflytande.

Ni har alla hört talas om så kallade deepfakes, videos och bilder som tycks visa riktiga människor i riktiga situationer, men som i själva verket är datorgenererade. Många av dessa är så klart kontroversiella, men nyligen har allt fler konstnärliga användningsområden börjat dyka upp, som t.ex Alper Yesiltas briljanta serie “As if nothing happened” som bevisar att AI också kan användas för att skapa skönhet. Men också, så klart, för kommersiella syften.

I praktiken

OK, slutfilosoferat. Låt oss pröva ett faktiskt e-handelsexempel. Ett enkelt sådant så klart, men ha överseende med mig medan vi testar något bara för skojs skull - innehållet som krävs för en fiktiv produktsida.

Jag började med OpenAI, och gav algoritmen uppgiften att producera “A product description about a tight-fitting red dress”, och satte längden till max 256 tecken. Här är resutlatet:

“Looking for something sexy and elegant all at once? This figure-hugging red dress is perfect for a night out on the town! The fitted silhouette will show off all your best assets, while the ruching detail on the side gives the dress a touch of glamour. Pair it with some strappy heels and you're sure to turn heads all night long!”

Inte illa! Inte säker på "ruching details" (veckade detaljer) och kanske att texten bitvis vandrade på gränsen till sexistisk? Nu surfar jag visserligen inte så mycket efter kvinnokläder själv, men min gissning är att resultatet knappast skiljer sig särskilt mycket i de aspekterna från verkligheten. Så att producera den text som behövs verkade knappast särskilt svårt, kändes som tillräckligt nära redan i första försöket. 

Nu till bilder. Det här visade sig snabbt mycket svårare. Till att börja med så skulle du ju så klart aldrig låta ditt AI designa den faktiska produkten för dig. Men bear with me here, poängen jag försöker göra här är att visa vilka möjligheter som finns snarare än en färdig verktygslåda.

Den första tjänsten jag testade heter Craiyon och den första instruktionen jag gav var “A woman in a red dress”. Efter cirka en minut fick jag de första resultaten (till vänster nedan):

Images from Craiyon


OK, så första försöket producerade en rätt rejält läskig kvinna. Inte är bara hennes grundläggande fysik rätt tveksam (är det där en servett istället för en arm..? 😱), ansiktet som sådant är som hämtat ur en mardröm. Jag är övertygad om att det här är ett stycke extremt imponerande datorkod, men slutresultatet är helt enkelt inte användbart.

Det som uppenbart är mest utmanande för verktyget är ett mänskligt ansikte, så på andra försöket (bilden till höger ovan) försökte jag skapa endast själva klänningen snarare än en modell med en klänning på. Jag fick en slimmad röd klänning, men av någon anledning (verktyget kanske hörde mina hånfulla kommentarer om dess första försök) avstod Craiyon att generera den del av klänningen som skulle innehållit ett huvud. Sammanfattningsvis, fortfarande rätt oanvändbart även i det här osannolika "jag har ingen faktisk produkt"-scenariot. Det är en röd klänning, men bara delar av den.

Dall-e Image


Dall-E-algoritmen från OpenAI levererade betydligt högre kvalitet. även det här verktyget hade problem med mänskliga händer, de ser mer ut som suddiga klumpar snarare än de eleganta, smala armarna du skulle vänta dig på en modell. Men klänningen och den i övrigt kvinnliga fysiken är ändå där. En riktigt imponerade funktion ger dig också möjligheten att skapa oändliga "variationer" på bilden du skapat. Så du kan alltså kunna få bilder av samma modell i samma klännning, men i obegränsat antal poser. Min backend-kollega Adil försäkrade mig också att det absolut går att jobba med algoritmen så att man får betydligt bättre kontroll över vilka poser och variationer vi skulle kunna få på ett automatiserat sätt.

Lexica search results


Även AI-motorn hos Lexica.art levererade riktigt lovande resultat. Precis som i fallet med Dall-E så tycks den mänskliga fysiken vara mest utmanande. Klänningen – inga problem, men modellernas ansikten kan väl i allra snällaste fall beskrivas som... suddiga.

Slutsatserna

Färdiglekt, och låt oss komma till poängen. AI-genererat innehåll är redan här. Det är inte längre en fråga om det kommer att användas brett, det görs det redan. Inte bara i enorma mängder AI-genererat textinnehåll, utan även mer skräddarsydda visuella lösningar (som är betydligt mer träffsäkra eftersom de är specialiserade på en viss typ av bilder, som klädmodeller) som ZMO.ai som redan är live och producerar högupplösta bilder för budgetvarumärken online som SHEIN. Och Optimizely, den svenska leverantören av e-handelsplattformar har helt nyligen lanserat en funktion för att kunna producera AI-bilder i deras Content Marketing-verktyg.

Men i sitt nuvarande läge bygger AI fortfarande enorma mängder data som verktygen samlar in för att lära sig och förbättras. Och som sådan kommer den (åtminstone inte initialt) inte försöka vara "edgy" eller ens unik, utan primärt bara försöka klara av att framstå mänsklig. På ett sätt kan man nog till och med hävda att den i första hand kommer att behöva klara av att vara genomsnittlig innan den kan försöka vara en superstjärna.

Som en mänsklig innehållsproducent så känns det betydligt mer som en lättnad än ett hot. Om vi människor kan lägga vår tid på att vara kreativa, göra våra varumärken unika och lämna uppdraget att beskriva 200 olika lågpris-kalsonger till en AI så är jag mer än OK med det. Och om ett AI-verktyg till och med kan göra det bättre än en människa – desto bättre eftersom det kommer att hjälpa vår SEO och därmed förhoppningsvis också våra konverteringar.

AI-genererat innehåll kan mycket väl vara nästa "stora grej", och jag kan verkligen rekommendera dig att ge dig ut och testa alla verktyg du kan hitta. Men i nuläget, efter att ha fått lärdomar av en kvinna med servettarmar, skulle jag fortfarande rekommendera korrekturläsning. 😉

(Undrar du över den märkliga Mona Lisa/Lego-konsten som jag använt som bild till artikeln? Den är genererad av Lexica.art, på kommandot "A product photo from the lego toy of monalisa")