Wat is ReALM?

ReALM staat voor “Reference Resolution As Language Modeling,” een baanbrekende oplossing ontwikkeld door Apple-onderzoekers. Het is dus een nieuw taalmodel (Large Language Model, LLM) dat het probleem van referentieherkenning behandelt als een taak op het gebied van taalmodellering.

ReALM zet effectief verschillende soorten context om in een tekstuele representatie, die het vervolgens verwerkt als onderdeel van een taaltaak. Dit kan onder andere omvatten:

  • gesprekken – zoals tekstberichten, spraakopdrachten aan een assistent, of e-mails,
  • elementen op het scherm – bijvoorbeeld foto’s, agenda, weerwidget, of applicaties en processen die op de achtergrond draaien.

Wat maakt ReALM anders dan andere modellen voor referentieherkenning? Ten eerste de aanpak – in plaats van afhankelijk te zijn van beeldverwerking, draait ReALM in het tekstdomein. Dit maakt het veel lichter en efficiënter, wat zou moeten toelaten dat het direct op mobiele apparaten draait terwijl de privacy van de gebruiker behouden blijft.

Op welke manieren is ReALM beter dan GPT-4?

Het onderzoeksteam van Apple vergeleek ReALM met de krachtigste taalmodellen op de markt vandaag – GPT-3.5 en GPT-4 van OpenAI. De resultaten waren indrukwekkend. In taken voor referentieherkenning bereikte de kleinste variant van ReALM een nauwkeurigheid die vergelijkbaar was met GPT-4! De grotere ReALM-modellen presteerden zelfs beter dan GPT-4 in het herkennen van referenties naar items die op het scherm worden weergegeven (http://arxiv.org/abs/2403.20329).

Wat verklaart dit voordeel? Ten eerste is ReALM geweldig met domeinspecifieke vragen, zoals die met betrekking tot slimme apparaten voor in huis. Dit komt omdat ReALM een dieper begrip van context demonstreert door het model te verfijnen voor domeinspecifieke gegevens.

Bovendien, in tegenstelling tot GPT-4, dat voornamelijk traint op afbeeldingen van echte objecten, blinkt ReALM uit in het herkennen van tekstuele elementen en componenten van gebruikersinterfaces van applicaties. En het is het begrip van interfaces dat cruciaal is voor de soepele interactie van spraakassistenten met de applicaties die we vandaag de dag gebruiken.

ReALM

Bron: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Is dit het begin van het tijdperk van echt intelligente assistenten?

Inderdaad, de integratie van ReALM met Siri zou een geheel nieuw hoofdstuk in de interactie tussen mens en computer kunnen openen. Met ReALM zal Siri in staat zijn om commando’s te begrijpen die verwijzingen naar items op het smartphone-scherm bevatten, evenals processen en applicaties die op de achtergrond draaien. Maar wanneer zal deze optie beschikbaar zijn voor gebruikers? Dat is nog onbekend.

We blijven achter met speculatie op basis van de technische mogelijkheden van het model. Hoe zou een Siri die op ReALM draait kunnen werken? Bijvoorbeeld, als je een zakelijke lijstwebsite doorzoekt en een bedrijf ziet dat je interesseert, zou je gewoon tegen Siri kunnen zeggen: “Bel dit bedrijf,” en de assistent – die ReALM gebruikt om de context te analyseren – zal het telefoonnummer van het door jou opgegeven bedrijf vinden en het gesprek starten. Je hoeft niet eens precies uit te leggen welk bedrijf je bedoelt.

A en dit is pas het begin van de mogelijkheden van ReALM. Opdrachten zoals “Speel de laatste afspeellijst af” zouden intuïtieve controle over multimedia-applicaties en slimme apparaten mogelijk maken. ReALM zou ook Siri kunnen helpen om de context van gesprekken en de geschiedenis van opdrachten te begrijpen, zodat de assistent adequaat reageert op eerdere verzoeken van de gebruiker. Dit is een stap in de richting van intelligente agenten die ons dichter bij een kunstmatige intelligentie brengt die niet alleen onze verzoeken begrijpt, maar ook weet hoe ze opdrachten moet uitvoeren.

En dit is nog maar het begin van wat ReALM kan doen. Opdrachten zoals “speel de laatste afspeellijst af” zouden intuïtieve controle over media-applicaties en slimme apparaten mogelijk maken. ReALM zou ook Siri kunnen helpen om de context van gesprekken en de geschiedenis van opdrachten te begrijpen, zodat de assistent adequaat reageert op eerdere verzoeken van de gebruiker. Dit is een stap in de richting van intelligente agenten, die ons dichter bij een kunstmatige intelligentie brengt die niet alleen onze verzoeken begrijpt, maar ook weet hoe ze opdrachten moet uitvoeren.

Helaas moeten gebruikers van Android-apparaten wachten. Momenteel is er geen informatie over de plannen van Google om de mogelijkheden van Gemini toe te voegen aan Google Assistant. Een Google Gemini-app voor Android-apparaten is ontwikkeld (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), maar deze is nog niet beschikbaar buiten de Verenigde Staten.

ReALM

Bron: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)

Samenvatting

ReALM is Apple’s innovatieve benadering van het oplossen van het probleem van contextherkenning door spraakassistenten. In plaats van afhankelijk te zijn van beeldverwerking, zet dit taalmodel verschillende soorten context om in een tekstuele representatie, die het vervolgens verwerkt in een taaltaak. Deze aanpak zorgt niet alleen voor een hoge herkenningsnauwkeurigheid, maar ook voor de mogelijkheid om op een mobiel apparaat te functioneren terwijl de privacy van de gebruiker behouden blijft.

Het geven van toegang aan Siri tot ReALM kan zorgen voor natuurlijkere en contextuele spraakinteracties, een belangrijke stap richting echt intelligente assistenten. Met ReALM zal Siri in staat zijn om onmiddellijk te reageren op commando’s die verband houden met schermitems, applicaties en achtergrondprocessen. Eén ding is zeker – het verbeteren van het contextueel bewustzijn van assistenten is de sleutel tot het creëren van echt intelligente en natuurlijke spraakinteracties, en ReALM is ongetwijfeld een belangrijke stap in die richting.

ReALM

Als je onze inhoud leuk vindt, sluit je dan aan bij onze drukke bijencommunity op Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

JavaScript-expert en instructeur die IT-afdelingen coacht. Zijn belangrijkste doel is om de productiviteit van het team te verhogen door anderen te leren hoe ze effectief kunnen samenwerken tijdens het coderen.

View all posts →

AI in business:

  1. 6 geweldige ChatGTP-plug-ins die je leven gemakkelijker zullen maken
  2. Navigeren door nieuwe zakelijke kansen met ChatGPT-4
  3. 3 geweldige AI-schrijvers die je vandaag moet uitproberen
  4. Synthetische acteurs. Top 3 AI video generators
  5. Wat zijn de zwakke punten van mijn zakelijke idee? Een brainstormsessie met ChatGPT
  6. ChatGPT in het bedrijfsleven gebruiken
  7. Nieuwe diensten en producten die met AI werken
  8. Geautomatiseerde sociale media berichten
  9. Het inplannen van sociale media berichten. Hoe kan AI helpen?
  10. De rol van AI in zakelijke besluitvorming
  11. Zakelijke NLP vandaag en morgen
  12. AI-ondersteunde tekstchatbots
  13. AI-toepassingen in het bedrijfsleven - overzicht
  14. Bedreigingen en kansen van AI in het bedrijfsleven (deel 2)
  15. Bedreigingen en kansen van AI in het bedrijfsleven (deel 1)
  16. Wat is de toekomst van AI volgens het McKinsey Global Institute?
  17. Kunstmatige intelligentie in het bedrijfsleven - Inleiding
  18. Wat is NLP, of natuurlijke taalverwerking in het bedrijfsleven
  19. Google Translate vs DeepL. 5 toepassingen van machinevertaling voor bedrijven
  20. Automatische documentverwerking
  21. De werking en zakelijke toepassingen van voicebots
  22. Virtuele assistent technologie, of hoe te praten met AI?
  23. Wat is Business Intelligence?
  24. Hoe kan kunstmatige intelligentie helpen bij BPM?
  25. Creatieve AI van vandaag en morgen
  26. Kunstmatige intelligentie in contentbeheer
  27. De kracht van AI in muziekcreatie verkennen
  28. 3 nuttige AI grafisch ontwerptools. Generatieve AI in het bedrijfsleven
  29. AI en sociale media - wat zeggen ze over ons?
  30. Zal kunstmatige intelligentie bedrijfsanalisten vervangen?
  31. AI-tools voor de manager
  32. De toekomstige arbeidsmarkt en opkomende beroepen
  33. RPA en API's in een digitaal bedrijf
  34. Nieuwe interacties. Hoe verandert AI de manier waarop we apparaten bedienen?
  35. Multimodale AI en de toepassingen ervan in het bedrijfsleven
  36. Kunstmatige intelligentie en het milieu. 3 AI-oplossingen om je te helpen een duurzaam bedrijf op te bouwen.
  37. AI-inhoudsdetectoren. Zijn ze het waard?
  38. ChatGPT vs Bard vs Bing. Welke AI-chatbot leidt de race?
  39. Is chatbot AI een concurrent van Google zoekopdracht?
  40. Effectieve ChatGPT-prompts voor HR en Werving
  41. Prompt engineering. Wat doet een prompt engineer?
  42. AI en wat nog meer? Toptechnologietrends voor bedrijven in 2024
  43. AI en bedrijfsethiek. Waarom je zou moeten investeren in ethische oplossingen
  44. Meta AI. Wat moet je weten over de door AI ondersteunde functies van Facebook en Instagram?
  45. AI-regulering. Wat moet je weten als ondernemer?
  46. 5 nieuwe toepassingen van AI in het bedrijfsleven
  47. AI-producten en -projecten - hoe verschillen ze van andere?
  48. AI als een expert in jouw team
  49. AI-team vs. rolverdeling
  50. Hoe kies je een carrièreveld in AI?
  51. AI in HR: Hoe wervingsautomatisering HR en teamontwikkeling beïnvloedt
  52. AI-ondersteunde procesautomatisering. Waar te beginnen?
  53. 6 meest interessante AI-tools in 2023
  54. Wat is de AI-maturiteitsanalyse van het bedrijf?
  55. AI voor B2B-personalisatie
  56. ChatGPT-toepassingen. 18 voorbeelden van hoe je je bedrijf in 2024 kunt verbeteren met ChatGPT
  57. AI Mockup-generator. Top 4 tools
  58. Microlearning. Een snelle manier om nieuwe vaardigheden te leren
  59. De meest interessante AI-implementaties in bedrijven in 2024
  60. Welke uitdagingen brengt het AI-project met zich mee?
  61. Top 8 AI-tools voor bedrijven in 2024
  62. AI in CRM. Wat verandert AI in CRM-tools?
  63. De EU AI-wet. Hoe reguleert Europa het gebruik van kunstmatige intelligentie
  64. Top 7 AI websitebouwers
  65. No-code tools en AI-innovaties
  66. Hoeveel verhoogt het gebruik van AI de productiviteit van je team?
  67. Hoe ChatGTP te gebruiken voor marktonderzoek?
  68. Hoe de reikwijdte van je AI-marketingcampagne te verbreden?
  69. AI in transport en logistiek
  70. Welke zakelijke pijnpunten kan AI oplossen?
  71. Hoe koppel je een AI-oplossing aan een zakelijk probleem?
  72. Kunstmatige intelligentie in de media
  73. AI in bankieren en financiën. Stripe, Monzo en Grab
  74. AI in de reisindustrie
  75. Hoe AI de geboorte van nieuwe technologieën bevordert
  76. AI in e-commerce. Overzicht van wereldwijde leiders
  77. Top 4 AI afbeeldingscreatietools
  78. Top 5 AI-tools voor data-analyse
  79. De revolutie van AI in sociale media
  80. Is het altijd de moeite waard om kunstmatige intelligentie toe te voegen aan het productontwikkelingsproces?
  81. 6 grootste zakelijke blunders veroorzaakt door AI
  82. AI-strategie in uw bedrijf - hoe bouw je het op?
  83. Beste AI-cursussen – 6 geweldige aanbevelingen
  84. Social media luisteren optimaliseren met AI-tools
  85. IoT + AI, of hoe energie kosten in een bedrijf te verlagen
  86. AI in logistiek. 5 beste tools
  87. GPT Store – een overzicht van de meest interessante GPT's voor bedrijven
  88. LLM, GPT, RAG... Wat betekenen AI-acroniemen?
  89. AI-robots – de toekomst of het heden van het bedrijfsleven?
  90. Wat zijn de kosten van het implementeren van AI in een bedrijf?
  91. Wat doen specialisten in kunstmatige intelligentie?
  92. Hoe kan AI helpen in de carrière van een freelancer?
  93. Automatiseren van werk en het verhogen van de productiviteit. Een gids voor AI voor freelancers
  94. AI voor startups – beste tools
  95. Een website bouwen met AI
  96. Elf Labs en wat nog meer? De meest veelbelovende AI-startups
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Wie is wie in de wereld van AI?
  98. Synthetische gegevens en het belang ervan voor de ontwikkeling van uw bedrijf
  99. Top AI-zoekmachines. Waar te zoeken naar AI-tools?
  100. Video AI. De nieuwste AI video generators
  101. AI voor managers. Hoe AI je werk gemakkelijker kan maken
  102. Wat is er nieuw in Google Gemini? Alles wat je moet weten
  103. AI in Polen. Bedrijven, vergaderingen en conferenties
  104. AI-kalender. Hoe optimaliseer je je tijd in een bedrijf?
  105. AI en de toekomst van werk. Hoe bereidt u uw bedrijf voor op verandering?
  106. AI-stemklonen voor bedrijven. Hoe maak je gepersonaliseerde stemberichten met AI?
  107. "We zijn allemaal ontwikkelaars". Hoe kunnen burgerontwikkelaars uw bedrijf helpen?
  108. Feitencontrole en AI-hallucinaties
  109. AI in werving – wervingsmaterialen stap voor stap ontwikkelen
  110. Sora. Hoe zullen realistische video's van OpenAI het bedrijfsleven veranderen?
  111. Midjourney v6. Innovaties in AI-beeldgeneratie
  112. AI in MKB's. Hoe kunnen MKB's concurreren met giganten met behulp van AI?
  113. Hoe verandert AI influencer marketing?
  114. Is AI echt een bedreiging voor ontwikkelaars? Devin en Microsoft AutoDev
  115. Beste AI-chatbots voor e-commerce. Platforms
  116. AI-chatbots voor e-commerce. Casestudy's
  117. Hoe blijf je op de hoogte van wat er gaande is in de AI-wereld?
  118. AI temmen. Hoe de eerste stappen te zetten om AI in uw bedrijf toe te passen?
  119. Perplexity, Bing Copilot of You.com? Vergelijking van AI-zoekmachines
  120. AI-experts in Polen
  121. ReALM. Een baanbrekend taalmodel van Apple?
  122. Google Genie — een generatief AI-model dat volledig interactieve werelden uit afbeeldingen creëert
  123. Automatisering of augmentatie? Twee benaderingen van AI in een bedrijf
  124. LLMOps, of hoe taalmodellen effectief te beheren in een organisatie
  125. AI-video generatie. Nieuwe horizonten in videoinhoudproductie voor bedrijven
  126. Beste AI-transcriptietools. Hoe lange opnames om te zetten in beknopte samenvattingen?
  127. Sentimentanalyse met AI. Hoe helpt het veranderingen in bedrijven te stimuleren?
  128. De rol van AI in contentmoderatie