Sora. Hoe zullen realistische video’s van OpenAI het bedrijfsleven veranderen? | AI in business #94

Een paar dagen geleden trok Google opnieuw de aandacht van AI-enthousiastelingen door Gemini 1.5 aan te kondigen, slechts een week na de release van het krachtige Gemini 1.0 Ultra-model en het hernoemen van de chatbot Bard naar Gemini.

Echter, OpenAI liet Google niet eens een dag genieten van een sterke positie op het gebied van AI. De makers van ChatGPT onthulden een nog spannender oplossing: Sora, een video-generator die in staat is om bijna een minuut lange video’s te creëren op basis van tekstuele prompts. OpenAI’s Sora staat op het punt een doorbraaktool te worden met het potentieel om de video-inhoudcreatie-industrie te revolutioneren. Wat Sora echter uitzonderlijk maakt, zijn niet alleen de technische mogelijkheden, maar ook de brede waaier aan potentiële toepassingen – van marketing en onderwijs tot de entertainmentindustrie en alledaagse communicatie. Laten we onderzoeken hoe Sora deze veranderingen wil teweegbrengen en welke vooruitzichten het opent voor bedrijven.

Sora van OpenAI – een nieuw tijdperk in video-inhoudcreatie

We hebben een lange weg afgelegd sinds de dagen van de eerste onhandige pogingen om video’s te maken met computers. Het is al duidelijk dat video’s die zijn gemaakt door generatieve kunstmatige intelligentie, zelfs die van slechts zes maanden oud, er behoorlijk onhandig uitzien in vergelijking met de generaties van Sora. Hoewel Sora, dat realistische videoscènes kan creëren op basis van tekstuele instructies, nog in de experimentele fase is en nog niet beschikbaar is voor het publiek, zijn de mogelijkheden verbluffend.

Sora biedt een breed scala aan toepassingen die de manier waarop we video-inhoud creëren en consumeren kunnen veranderen. Hier zijn een paar voorbeelden:

  • het genereren van complexe scènes met meerdere personages of objecten,
  • het animeren van al bestaande afbeeldingen,
  • het bewerken van gemaakte video’s,
  • het combineren van verschillende graphics of video’s tot één.

Deze voorbeelden tonen enorme vooruitgang op het gebied van AI. Maar bovenal opent het de deur naar nieuwe mogelijkheden in het creëren van video-inhoud. Kijk maar naar de presentatie van een video in hoge resolutie die de schoonheid van een bloeiende bloem afbeeldt:

Bron: OpenAI (https://cdn.openai.com/sora/videos/flower-blooming.mp4 of https://youtu.be/UNmqxZoTgsk)

Hoe zal Sora worden gebruikt?

Is Sora gewoon een speeltje en een ander hulpmiddel voor het creëren van video-inhoud? Nee. Althans, volgens OpenAI. Zoals de makers van Sora schrijven:

We leren kunstmatige intelligentie om de fysieke wereld in beweging te begrijpen en te simuleren, en het doel is om modellen te trainen die mensen helpen problemen op te lossen die interactie met de echte wereld vereisen.

Om video’s nauwkeurig te genereren, moet het model de wereld op een veel dieper niveau begrijpen dan wat nodig is voor tekstcreatie. Dit houdt in dat het de natuurkunde, ruimtelijke relaties tussen objecten op hetzelfde vlak en de interactie tussen voorgrond en achtergrond moet begrijpen.

Sora zal in staat zijn om te genereren:

  • video van tekst – de eerste en belangrijkste innovatie van het model,
  • video van afbeeldingen – waarmee de animatie van bestaande generaties die in DALL·E 3 zijn gemaakt mogelijk is,
  • video van afbeelding en tekst – wat zorgt voor nauwkeurigere filmcreatie,
  • video van video – het toevoegen van speciale effecten, het verlengen van de film, het combineren van twee bestaande opnames of het veranderen van de videostijl,
  • afbeeldingen van tekst – vermoedelijk uiteindelijk DALL·E vervangen en generaties met een resolutie van 2048×2048 aanbieden.

In de toekomst zou Sora kunnen worden gebruikt om promotievideo’s, inhoud voor sociale media of zakelijke presentaties te maken. Het is een tool die de manier waarop we video-inhoud creëren en delen volledig kan veranderen:

Bron: OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 of https://youtu.be/3l8wjxjNubE)

Hoewel deze kolossale stap in de ontwikkeling van generatieve kunstmatige intelligentie opwindend is, roept het ook zorgen op over de risico’s die gepaard gaan met deepfakes, vooral in relatie tot de Amerikaanse presidentsverkiezingen. De bedreigingen die gepaard gaan met het gebruik van Sora omvatten voornamelijk:

  • Desinformatie. Deepfakes, waaronder fotorealistische video’s die door Sora zijn gegenereerd, kunnen nepnieuws verspreiden dat de publieke opinie kan beïnvloeden en de democratie kan ondermijnen. Door nepvideo’s te maken die echt lijken, kunnen kijkers worden gemanipuleerd en misleid.
  • Schending van de privacy. Het beschikbaar maken van Sora zou iedereen met een computer en internettoegang in staat stellen om nepinhoud te creëren, inclusief video’s die de privacy schenden en persoonlijke gegevens zonder toestemming misbruiken. Waarschijnlijk om deze reden zal het enige tijd duren voordat Sora beschikbaar is voor het grote publiek. OpenAI moet ervoor zorgen dat er passende waarborgen zijn.
  • Schadelijke reputatie. Door Sora te gebruiken, kunnen hackers zich voordoen als andere individuen, organisaties of merken om hen te belasteren. Door de indruk te wekken dat iemand dingen zegt of doet die hij of zij nooit heeft gedaan, kunnen dergelijke video’s de reputatie en geloofwaardigheid aanzienlijk schaden. Het combineren van deepfake-technologie met AI-gebaseerde stemkloning kan helaas leiden tot de creatie van veel zeer overtuigende vervalsingen. Naarmate we een punt naderen waarop het extreem moeilijk wordt om een vervalsing van een echte opname te onderscheiden, worden waakzaamheid, bewustzijn en kritisch denken steeds crucialer in de strijd tegen de potentiële schade die door deepfakes wordt veroorzaakt.

Daarom, hoewel de mogelijkheden van Sora indrukwekkend zijn, moeten we voorzichtig zijn met hun impact op de samenleving, regelgeving creëren en aanvullende stappen ondernemen om hun negatieve gevolgen te minimaliseren.

Hoe Sora te gebruiken?

Hoewel Sora momenteel in de testfase is en nog niet beschikbaar is voor een breder publiek, lijkt het gebruik ervan een eenvoudig en intuïtief proces te zijn. Gebruikers zullen het waarschijnlijk kunnen gebruiken zoals ze nu DALL-E 3 in ChatGPT Plus gebruiken. Dat wil zeggen, tekstcommando’s typen, die Sora zal omzetten in korte videoclips. Dit biedt nieuwe mogelijkheden voor contentmakers, marketeers en docenten, waardoor ze snel boeiende, hoogwaardige video’s kunnen maken.

Hoe verhoudt Sora zich tot andere AI-video-generatoren?

Maar hoe verhoudt Sora zich tot andere video-generatoren? Voorlopig kunnen we alleen speculeren over hoe Sora zal presteren, maar op basis van de beschrijving van de tool op de OpenAI-website kunnen we enkele algemene observaties maken:

  • Runway – Sora zal op een vergelijkbare manier werken, maar met veel hogere realisme. Runway stelt je in staat om video- en afbeeldingsinhoud te creëren met behulp van AI, inclusief tekst-naar-video en afbeelding-naar-afbeelding opties. Het biedt ook bewerkingsverbeteringen zoals het verwijderen van achtergronden en het vervangen van elementen op basis van tekstcommando’s.
  • Synthesia – het platform werkt anders dan Sora, omdat het de creatie van realistische video’s met digitale avatars aanbiedt, die meer dan 120 talen ondersteunen en het creëren van aangepaste avatars mogelijk maken. We weten nog niet hoe Sora taken zoals het combineren van audio of het genereren van spraak met het visuele materiaal dat het creëert, zal aanpakken.
  • HeyGen – zijn uniciteit ligt in stemkloning en de mogelijkheid om een avatar met aangepaste gebaren te creëren, waardoor de functionaliteit aanzienlijk verschilt van die van Sora.
  • Stable Video Diffusion – waarschijnlijk Sora’s meest serieuze directe concurrent, in staat om statische afbeeldingen om te zetten in video-animaties, voornamelijk voor sociale media-inhoudmakers. De experimentele aard en het feit dat het is gebaseerd op open-access modellen, wekt hoge verwachtingen in de context van filmproductie en animatie.

Sora verschilt van andere video-generatietools omdat het zeer realistische video’s maakt die sterk lijken op echte opnames. Resolutie is hier bijzonder belangrijk. Sora kan video’s maken met resoluties tot 1920x1080px.

Met zijn diepe begrip van taal interpreteert het model commando’s nauwkeurig. Hier heeft OpenAI de methode gebruikt die bewezen is in DALL-E 3. Het model interpreteert eerst een eenvoudige prompt die door de gebruiker is ingevoerd en genereert vervolgens visuele inhoud op basis van zijn uitgebreide en gedetailleerde versie. Dit stelt het in staat om complexe scènes te creëren en personages te genereren die authentieke emoties uitdrukken:

Bron: OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 of https://youtu.be/pxkfUDoQg5I)

Hoe kan Sora de creatieve industrie beïnvloeden?

Het potentieel van Sora om de creatieve industrie te transformeren is enorm. Toegang tot deze tool voor filmmakers en ontwerpers brengt een nieuwe kwaliteit in de creatie van video-inhoud. Sora dient als basis voor modellen die in staat zijn om de echte wereld te simuleren, wat een doorbraak zou kunnen zijn in het bereiken van AGI (Artificial General Intelligence). Althans, dat beweren de makers, OpenAI.

Aangezien Sora realistische bewegende beelden creëert die vergelijkbaar zijn met die gefilmd door menselijke hand, heeft het de potentie om het veld van video-creatie aanzienlijk te veranderen, van trainingsmaterialen tot Hollywood-producties. Sora zal ongetwijfeld invloed hebben op:

  • Marketing. Sora heeft de potentie om reclamecampagnes te revolutioneren door snel aantrekkelijke video-inhoud te genereren op basis van marketingberichten of productbeschrijvingen.
  • Entertainmentindustrie. Filmstudies en contentmakers kunnen profiteren van Sora’s vermogen om realistische scènes en personages te creëren, waardoor productieprocessen worden gestroomlijnd.
  • Games. Game-ontwikkelaars kunnen Sora gebruiken om films of trailers binnen games te creëren, waardoor de ervaringen van spelers worden verbeterd.
  • Training. De eenvoud van het creëren van hoogwaardige educatieve materialen, inclusief “hoe-te” instructievideo’s, kan de aantrekkelijkheid van trainingen en cursussen aanzienlijk vergroten.

Bron: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Hoe kunnen bedrijven profiteren van realistische AI-video?

Het gebruik van AI in video-productie biedt bedrijven een reeks voordelen, zoals tijd- en kostenbesparingen, consistente kwaliteit van resultaten en verhoogde waarde van het eindproduct. OpenAI onderneemt stappen om de veiligheid van Sora te waarborgen, waaronder samenwerking met teams voor anti-tegenmaatregelen en het ontwikkelen van een classifier om AI-gegenereerde video’s te detecteren.

Sora van OpenAI opent nieuwe mogelijkheden voor het creëren en consumeren van video-inhoud. Van het revolutioneren van de creatieve industrie tot het beïnvloeden van marketing en onderwijs, tot het beïnvloeden van alledaagse communicatie – het potentieel is enorm. Als een tool die de spelregels volledig kan veranderen, verdient Sora speciale aandacht. We kijken uit naar verdere informatie van OpenAI, vooral over wanneer Sora beschikbaar zal komen voor het bredere publiek. Dit markeert het begin van een nieuw tijdperk in video-inhoudcreatie. De volgende stap is de integratie met geluid, stem en 3D-modellen, wat deuren zal openen naar de metaverse.

Als je onze inhoud leuk vindt, sluit je dan aan bij onze drukke bijengemeenschap op Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

JavaScript-expert en instructeur die IT-afdelingen coacht. Zijn belangrijkste doel is om de productiviteit van het team te verhogen door anderen te leren hoe ze effectief kunnen samenwerken tijdens het coderen.

View all posts →

Robert Whitney

JavaScript-expert en instructeur die IT-afdelingen coacht. Zijn belangrijkste doel is om de productiviteit van het team te verhogen door anderen te leren hoe ze effectief kunnen samenwerken tijdens het coderen.

Share
Published by
Robert Whitney

Recent Posts

De rol van AI in contentmoderatie | AI in business #129

Bedrijven worstelen met het beheren van een enorme hoeveelheid content die online wordt gepubliceerd, van…

2 days ago

Sentimentanalyse met AI. Hoe helpt het om verandering in bedrijven te stimuleren? | AI in business #128

In het tijdperk van digitale transformatie hebben bedrijven toegang tot een ongekende hoeveelheid gegevens over…

2 days ago

Beste AI-transcriptietools. Hoe lange opnames om te zetten in beknopte samenvattingen? | AI in business #127

Wist je dat je de essentie van een meerdaagse opname van een vergadering of gesprek…

2 days ago

AI-video generatie. Nieuwe horizonten in videoinhoudproductie voor bedrijven | AI in business #126

Stel je een wereld voor waarin jouw bedrijf boeiende, gepersonaliseerde video's kan maken voor elke…

2 days ago

LLMOps, of hoe taalmodellen effectief te beheren in een organisatie | AI in business #125

Om het potentieel van Large Language Models (LLM's) volledig te benutten, moeten bedrijven een effectieve…

2 days ago

Automatisering of augmentatie? Twee benaderingen van AI in een bedrijf | AI in het bedrijfsleven #124

In 2018 was Unilever al begonnen aan een bewuste reis om automatisering en augmentatie in…

2 days ago