Midjourney v6. Innovaties in AI-beeldgeneratie | AI in het bedrijfsleven #112

Hoe de mogelijkheden van Midjourney in het bedrijfsleven te gebruiken?

Als je je ideeën onmiddellijk wilt visualiseren, zonder grafisch ontwerpers in te huren en te wachten tot projecten zijn afgerond, is Midjourney v6 een van de meest interessante AI-tools op de markt. Het stelt je in staat om snel en efficiënt te creëren:

  • prototypes,
  • productvisualisaties,
  • conceptuele materialen.

Een van de beste voorbeelden van het gebruik van Midjourney is wanneer een tech-startup een visie van zijn toekomstige product aan investeerders wil presenteren. Het enige wat nodig is, zijn een paar goed geformuleerde prompts, of tekst aanwijzingen voor kunstmatige intelligentie, en Midjourney genereert een reeks afbeeldingen om het idee in al zijn glorie te zien.

Een andere toepassing is het creëren van marketing- en advertentie-inhoud. In plaats van afhankelijk te zijn van fotoshoots, kun je je visuele communicatie baseren op unieke en opvallende afbeeldingen die direct voor jouw behoeften zijn gemaakt:

  • advertentiecampagnes,
  • promotiematerialen,
  • productverpakkingen.

Midjourney speelt een sleutelrol in het helpen afstemmen van de uitstraling en het gevoel van een product met de klant. Het stelt je in staat om snel te experimenteren met verschillende stijlen, composities en technieken in real-time.

Bron: Midjourney, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Hoe werkt Midjourney?

Midjourney creëert visuele representaties op basis van tekstuele gebruikersinstructies die “prompts” worden genoemd. Het vertrouwt op een complex neuraal netwerk dat is getraind op miljoenen voorbeelden van afbeeldingen en tekst om patronen en verbindingen tussen woorden en visuals te herkennen.

Communicatie met Midjourney gebeurt via Discord, waar gebruikers hun prompts verzenden en de tool de bijbehorende afbeeldingen genereert. Taalmodellen interpreteren de betekenis van de woorden van de gebruiker en genereren afbeeldingen op basis van deze interpretaties. Een typisch proces ziet er als volgt uit:

  1. De gebruiker voert een prompt in, zoals “Een realistisch portret van een oudere vrouw in de Renaissance-stijl, met geaccentueerde gezichtsdetails en rijke kleuren.”
  2. Midjourney analyseert de prompt en genereert vier initiële afbeeldingen volgens de instructies van de gebruiker.
  3. Als de resultaten niet volledig bevredigend zijn, kan de gebruiker de prompt aanpassen of aanvullende instructies toevoegen om het gewenste resultaat te verfijnen.
  4. Midjourney houdt rekening met de gewijzigde instructies en genereert een nieuwe reeks afbeeldingen.
  5. Dit proces wordt herhaald totdat een bevredigend resultaat is verkregen.

Dankzij het geavanceerde machine learning-proces en de steeds groeiende database is Midjourney in staat om extreem realistische en gedetailleerde afbeeldingen te creëren die eruitzien als handgemaakte werken van kunstenaars. Bovendien evolueert de tool voortdurend om de taal beter te begrijpen en betere afbeeldingen te genereren.

Bron: Midjourney, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Wat is nieuw in Midjourney v6?

De nieuwste versie van Midjourney, bekend als v6, brengt een aantal innovaties die de mogelijkheden van deze krachtige tool aanzienlijk verbeteren. Onder de belangrijkste zijn gemakkelijker en natuurlijker prompten, de mogelijkheid om ondertitels te maken, nog meer realisme in de gemaakte afbeeldingen en verbeterde composities.

Gemakkelijker prompten

Een van de belangrijkste veranderingen in Midjourney v6 is een verbeterd taalmodel dat een intuïtievere en nauwkeurigere formulering van prompts mogelijk maakt. In eerdere versies was het soms moeilijk om de gewenste resultaten te krijgen, zelfs met nauwkeurige beschrijvingen. De nieuwe versie doet een veel betere job in het interpreteren van complexe en beschrijvende prompts, waardoor het gemakkelijker wordt om de visie van de gebruiker te communiceren.

Bijvoorbeeld, de prompt “…een oud houten schip met een zeil in een fles, liggend op een houten tafel in een verlaten haven, met zonsondergangstralen die door een stoffig raam komen…” zou eerder problemen voor het algoritme hebben veroorzaakt. Echter, v6 Midjourney is in staat om veel details zoals materialen, verlichting, perspectief en sfeer te begrijpen en te integreren om afbeeldingen te genereren die perfect deze beschrijvende instructie weerspiegelen.

Bron: Midjourney, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Genereren van ondertitels

Een andere grote innovatie in Midjourney v6 is de sterk verbeterde mogelijkheid om bijschriften te maken en deze met de afbeelding te integreren. In eerdere versies resulteerden pogingen om tekst te genereren vaak in vage tekst of een reeks letters die ruwweg op woorden leken. Nu kan Midjourney leesbare bijschriften in verschillende stijlen en interessante lettertypen plaatsen. Dit opent nieuwe mogelijkheden voor het creëren van:

  • logotypes,
  • advertenties,
  • posters en andere grafische materialen met tekst.
Nog realistischere afbeeldingen

Midjourney v6 introduceert ook verbeterde beeldkwaliteit die het dichter bij de realiteit van fotografie brengt. Verbeteringen omvatten:

  • natuurlijker licht,
  • nauwkeuriger textuurreproductie,
  • betere behoud van verhoudingen.

De resultaten zien er extreem realistisch uit en zijn vaak moeilijk te onderscheiden van een foto.

Betere compositie

Naast verhoogd realisme belooft Midjourney v6 ook verbeteringen in de beeldcompositie. Een van de veelvoorkomende pijnpunten van eerdere versies was de onnatuurlijke plaatsing van elementen in een scène, waardoor het op het eerste gezicht duidelijk was dat er iets “mis” was met de afbeelding. De nieuwe versie gaat beter om met de verhoudingen en plaatsing van objecten, waardoor er meer gebalanceerde en esthetisch aangename composities ontstaan.

Beperkingen van Midjourney v6

Betekent dit dat het geen zin heeft om fotografie na te streven en dat Midjourney v6 perfectie heeft bereikt? Niet echt. Ondanks de vele voordelen en innovaties heeft Midjourney v6 nog steeds enkele beperkingen. Sommige zijn van technische aard, zoals de moeilijkheid om toegang te krijgen tot de tool, aangezien het noodzakelijk is om je te registreren op Discord waar je afbeeldingen kunt prompten. Andere hebben betrekking op de onmogelijkheid om de resultaten fijn af te stemmen of om je eigen materialen, zoals productafbeeldingen, in de gegenereerde afbeeldingen in te voegen.

De noodzaak om Discord te gebruiken

Ondanks plannen voor een speciale web- en mobiele app, werkt Midjourney voorlopig nog steeds voornamelijk via de Discord-app. Voor novice gebruikers kan dit een beetje een hindernis zijn, omdat ze zowel Discord als de afbeeldingscreatietool zelf moeten beheersen.

De Midjourney-webapplicatie is momenteel alleen beschikbaar voor betalende gebruikers die al meer dan 1.000 afbeeldingen hebben gegenereerd.

Belemmerde werkzaamheden aan resultaten

Hoewel Midjourney v6 een betere job doet in het interpreteren van complexe prompts, kan het nog steeds moeite hebben om details en elementen te behouden bij het werken aan dezelfde afbeelding. Na een paar aanpassingen kan het model beginnen enkele aspecten van de afbeelding te verliezen, waardoor het moeilijk wordt om deze naar de gewenste staat te brengen.

Aanpassingen, zoals het veranderen van de verlichting of het toevoegen van achtergrondelementen, kunnen ervoor zorgen dat de figuren of objecten beginnen te veranderen en de compositie vervaagt. Na verschillende iteraties kan het model beginnen enkele van de eerdere details van het portret zelf te verliezen, zoals nauwkeurige gelaatskenmerken of texturen.

Hoge kosten voor bedrijven

Hoewel Midjourney een verscheidenheid aan abonnementsplannen biedt met redelijke prijzen voor individuele gebruikers, kunnen de kosten snel oplopen voor bedrijven die honderden of duizenden afbeeldingen per maand moeten genereren voor marketingcampagnes of projecten. Vooral voor geavanceerde toepassingen die maximale resolutie en kwaliteit vereisen, kan de prijs per afbeelding enkele dollars bereiken, wat een aanzienlijke uitgave op jaarbasis kan zijn.

Bron: Midjourney (https://docs.midjourney.com/docs/plans)

Beperkende regels voor inhoudgeneratie

Midjourney, net als andere AI-afbeeldinggeneratietools, heeft een aantal ingebouwde beperkingen en filters om misbruik van de technologie te voorkomen. Bijvoorbeeld, er zijn beperkingen op het genereren van valse afbeeldingen van beroemde mensen of extremist of criminele inhoud. Hoewel deze beperkingen legitieme ethische en juridische redenen hebben, kunnen ze ook als een belemmering voor sommige creatieve ideeën fungeren. De gedetailleerde bepalingen van Midjourney’s privacybeleid zijn hier te vinden: https://docs.midjourney.com/docs/privacy-policy. Ondertussen kun je de gebruiksvoorwaarden vinden, die regelmatig moeten worden gecontroleerd, vooral voor commercieel gebruik van door Midjourney gegenereerde afbeeldingen, op deze link: https://docs.midjourney.com/docs/terms-of-service.

Samenvatting

Midjourney v6 is de volgende stap in het creëren van AI-afbeeldingen die niet te onderscheiden zijn van foto’s. Het biedt een aantal innovaties die de kwaliteit, het realisme en de mogelijkheden van deze tool verbeteren. Gemakkelijker en natuurlijker prompten, de mogelijkheid om leesbare bijschriften te maken, verhoogd beeldrealisme en betere compositie zijn slechts enkele van de belangrijkste verbeteringen die deze versie extreem aantrekkelijk maken voor bedrijven, kunstenaars en makers.

Maar net als elke technologie is Midjourney v6 niet zonder zijn beperkingen. De noodzaak om Discord te gebruiken, de moeilijkheid om afbeeldingen nauwkeurig te bewerken, periodieke logische fouten, hoge kosten voor bedrijven en beperkende regels voor het creëren van inhoud zijn allemaal aspecten om te overwegen voordat je besluit deze tool te gebruiken.

Als je onze inhoud leuk vindt, sluit je dan aan bij onze drukke bijengemeenschap op Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

JavaScript-expert en instructeur die IT-afdelingen coacht. Zijn belangrijkste doel is om de productiviteit van het team te verhogen door anderen te leren hoe ze effectief kunnen samenwerken tijdens het coderen.

View all posts →

Robert Whitney

JavaScript-expert en instructeur die IT-afdelingen coacht. Zijn belangrijkste doel is om de productiviteit van het team te verhogen door anderen te leren hoe ze effectief kunnen samenwerken tijdens het coderen.

Share
Published by
Robert Whitney

Recent Posts

De rol van AI in contentmoderatie | AI in business #129

Bedrijven worstelen met het beheren van een enorme hoeveelheid content die online wordt gepubliceerd, van…

2 days ago

Sentimentanalyse met AI. Hoe helpt het om verandering in bedrijven te stimuleren? | AI in business #128

In het tijdperk van digitale transformatie hebben bedrijven toegang tot een ongekende hoeveelheid gegevens over…

2 days ago

Beste AI-transcriptietools. Hoe lange opnames om te zetten in beknopte samenvattingen? | AI in business #127

Wist je dat je de essentie van een meerdaagse opname van een vergadering of gesprek…

2 days ago

AI-video generatie. Nieuwe horizonten in videoinhoudproductie voor bedrijven | AI in business #126

Stel je een wereld voor waarin jouw bedrijf boeiende, gepersonaliseerde video's kan maken voor elke…

2 days ago

LLMOps, of hoe taalmodellen effectief te beheren in een organisatie | AI in business #125

Om het potentieel van Large Language Models (LLM's) volledig te benutten, moeten bedrijven een effectieve…

2 days ago

Automatisering of augmentatie? Twee benaderingen van AI in een bedrijf | AI in het bedrijfsleven #124

In 2018 was Unilever al begonnen aan een bewuste reis om automatisering en augmentatie in…

2 days ago