ReALM – inhoudsopgave
Wat is ReALM?
ReALM staat voor “Reference Resolution As Language Modeling,” een baanbrekende oplossing ontwikkeld door Apple-onderzoekers. Het is dus een nieuw taalmodel (Large Language Model, LLM) dat het probleem van referentieherkenning behandelt als een taak op het gebied van taalmodellering.
ReALM zet effectief verschillende soorten context om in een tekstuele representatie, die het vervolgens verwerkt als onderdeel van een taaltaak. Dit kan onder andere omvatten:
- gesprekken – zoals tekstberichten, spraakopdrachten aan een assistent, of e-mails,
- elementen op het scherm – bijvoorbeeld foto’s, agenda, weerwidget, of applicaties en processen die op de achtergrond draaien.
Wat maakt ReALM anders dan andere modellen voor referentieherkenning? Ten eerste de aanpak – in plaats van afhankelijk te zijn van beeldverwerking, draait ReALM in het tekstdomein. Dit maakt het veel lichter en efficiënter, wat zou moeten toelaten dat het direct op mobiele apparaten draait terwijl de privacy van de gebruiker behouden blijft.
Op welke manieren is ReALM beter dan GPT-4?
Het onderzoeksteam van Apple vergeleek ReALM met de krachtigste taalmodellen op de markt vandaag – GPT-3.5 en GPT-4 van OpenAI. De resultaten waren indrukwekkend. In taken voor referentieherkenning bereikte de kleinste variant van ReALM een nauwkeurigheid die vergelijkbaar was met GPT-4! De grotere ReALM-modellen presteerden zelfs beter dan GPT-4 in het herkennen van referenties naar items die op het scherm worden weergegeven (http://arxiv.org/abs/2403.20329).
Wat verklaart dit voordeel? Ten eerste is ReALM geweldig met domeinspecifieke vragen, zoals die met betrekking tot slimme apparaten voor in huis. Dit komt omdat ReALM een dieper begrip van context demonstreert door het model te verfijnen voor domeinspecifieke gegevens.
Bovendien, in tegenstelling tot GPT-4, dat voornamelijk traint op afbeeldingen van echte objecten, blinkt ReALM uit in het herkennen van tekstuele elementen en componenten van gebruikersinterfaces van applicaties. En het is het begrip van interfaces dat cruciaal is voor de soepele interactie van spraakassistenten met de applicaties die we vandaag de dag gebruiken.

Bron: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
Is dit het begin van het tijdperk van echt intelligente assistenten?
Inderdaad, de integratie van ReALM met Siri zou een geheel nieuw hoofdstuk in de interactie tussen mens en computer kunnen openen. Met ReALM zal Siri in staat zijn om commando’s te begrijpen die verwijzingen naar items op het smartphone-scherm bevatten, evenals processen en applicaties die op de achtergrond draaien. Maar wanneer zal deze optie beschikbaar zijn voor gebruikers? Dat is nog onbekend.
We blijven achter met speculatie op basis van de technische mogelijkheden van het model. Hoe zou een Siri die op ReALM draait kunnen werken? Bijvoorbeeld, als je een zakelijke lijstwebsite doorzoekt en een bedrijf ziet dat je interesseert, zou je gewoon tegen Siri kunnen zeggen: “Bel dit bedrijf,” en de assistent – die ReALM gebruikt om de context te analyseren – zal het telefoonnummer van het door jou opgegeven bedrijf vinden en het gesprek starten. Je hoeft niet eens precies uit te leggen welk bedrijf je bedoelt.
A en dit is pas het begin van de mogelijkheden van ReALM. Opdrachten zoals “Speel de laatste afspeellijst af” zouden intuïtieve controle over multimedia-applicaties en slimme apparaten mogelijk maken. ReALM zou ook Siri kunnen helpen om de context van gesprekken en de geschiedenis van opdrachten te begrijpen, zodat de assistent adequaat reageert op eerdere verzoeken van de gebruiker. Dit is een stap in de richting van intelligente agenten die ons dichter bij een kunstmatige intelligentie brengt die niet alleen onze verzoeken begrijpt, maar ook weet hoe ze opdrachten moet uitvoeren.
En dit is nog maar het begin van wat ReALM kan doen. Opdrachten zoals “speel de laatste afspeellijst af” zouden intuïtieve controle over media-applicaties en slimme apparaten mogelijk maken. ReALM zou ook Siri kunnen helpen om de context van gesprekken en de geschiedenis van opdrachten te begrijpen, zodat de assistent adequaat reageert op eerdere verzoeken van de gebruiker. Dit is een stap in de richting van intelligente agenten, die ons dichter bij een kunstmatige intelligentie brengt die niet alleen onze verzoeken begrijpt, maar ook weet hoe ze opdrachten moet uitvoeren.
Helaas moeten gebruikers van Android-apparaten wachten. Momenteel is er geen informatie over de plannen van Google om de mogelijkheden van Gemini toe te voegen aan Google Assistant. Een Google Gemini-app voor Android-apparaten is ontwikkeld (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), maar deze is nog niet beschikbaar buiten de Verenigde Staten.

Bron: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)
Samenvatting
ReALM is Apple’s innovatieve benadering van het oplossen van het probleem van contextherkenning door spraakassistenten. In plaats van afhankelijk te zijn van beeldverwerking, zet dit taalmodel verschillende soorten context om in een tekstuele representatie, die het vervolgens verwerkt in een taaltaak. Deze aanpak zorgt niet alleen voor een hoge herkenningsnauwkeurigheid, maar ook voor de mogelijkheid om op een mobiel apparaat te functioneren terwijl de privacy van de gebruiker behouden blijft.
Het geven van toegang aan Siri tot ReALM kan zorgen voor natuurlijkere en contextuele spraakinteracties, een belangrijke stap richting echt intelligente assistenten. Met ReALM zal Siri in staat zijn om onmiddellijk te reageren op commando’s die verband houden met schermitems, applicaties en achtergrondprocessen. Eén ding is zeker – het verbeteren van het contextueel bewustzijn van assistenten is de sleutel tot het creëren van echt intelligente en natuurlijke spraakinteracties, en ReALM is ongetwijfeld een belangrijke stap in die richting.

Als je onze inhoud leuk vindt, sluit je dan aan bij onze drukke bijencommunity op Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Robert Whitney
JavaScript-expert en instructeur die IT-afdelingen coacht. Zijn belangrijkste doel is om de productiviteit van het team te verhogen door anderen te leren hoe ze effectief kunnen samenwerken tijdens het coderen.
AI in business:
- 6 geweldige ChatGTP-plug-ins die je leven gemakkelijker zullen maken
- Navigeren door nieuwe zakelijke kansen met ChatGPT-4
- 3 geweldige AI-schrijvers die je vandaag moet uitproberen
- Synthetische acteurs. Top 3 AI video generators
- Wat zijn de zwakke punten van mijn zakelijke idee? Een brainstormsessie met ChatGPT
- ChatGPT in het bedrijfsleven gebruiken
- Nieuwe diensten en producten die met AI werken
- Geautomatiseerde sociale media berichten
- Het inplannen van sociale media berichten. Hoe kan AI helpen?
- De rol van AI in zakelijke besluitvorming
- Zakelijke NLP vandaag en morgen
- AI-ondersteunde tekstchatbots
- AI-toepassingen in het bedrijfsleven - overzicht
- Bedreigingen en kansen van AI in het bedrijfsleven (deel 2)
- Bedreigingen en kansen van AI in het bedrijfsleven (deel 1)
- Wat is de toekomst van AI volgens het McKinsey Global Institute?
- Kunstmatige intelligentie in het bedrijfsleven - Inleiding
- Wat is NLP, of natuurlijke taalverwerking in het bedrijfsleven
- Google Translate vs DeepL. 5 toepassingen van machinevertaling voor bedrijven
- Automatische documentverwerking
- De werking en zakelijke toepassingen van voicebots
- Virtuele assistent technologie, of hoe te praten met AI?
- Wat is Business Intelligence?
- Hoe kan kunstmatige intelligentie helpen bij BPM?
- Creatieve AI van vandaag en morgen
- Kunstmatige intelligentie in contentbeheer
- De kracht van AI in muziekcreatie verkennen
- 3 nuttige AI grafisch ontwerptools. Generatieve AI in het bedrijfsleven
- AI en sociale media - wat zeggen ze over ons?
- Zal kunstmatige intelligentie bedrijfsanalisten vervangen?
- AI-tools voor de manager
- De toekomstige arbeidsmarkt en opkomende beroepen
- RPA en API's in een digitaal bedrijf
- Nieuwe interacties. Hoe verandert AI de manier waarop we apparaten bedienen?
- Multimodale AI en de toepassingen ervan in het bedrijfsleven
- Kunstmatige intelligentie en het milieu. 3 AI-oplossingen om je te helpen een duurzaam bedrijf op te bouwen.
- AI-inhoudsdetectoren. Zijn ze het waard?
- ChatGPT vs Bard vs Bing. Welke AI-chatbot leidt de race?
- Is chatbot AI een concurrent van Google zoekopdracht?
- Effectieve ChatGPT-prompts voor HR en Werving
- Prompt engineering. Wat doet een prompt engineer?
- AI en wat nog meer? Toptechnologietrends voor bedrijven in 2024
- AI en bedrijfsethiek. Waarom je zou moeten investeren in ethische oplossingen
- Meta AI. Wat moet je weten over de door AI ondersteunde functies van Facebook en Instagram?
- AI-regulering. Wat moet je weten als ondernemer?
- 5 nieuwe toepassingen van AI in het bedrijfsleven
- AI-producten en -projecten - hoe verschillen ze van andere?
- AI als een expert in jouw team
- AI-team vs. rolverdeling
- Hoe kies je een carrièreveld in AI?
- AI in HR: Hoe wervingsautomatisering HR en teamontwikkeling beïnvloedt
- AI-ondersteunde procesautomatisering. Waar te beginnen?
- 6 meest interessante AI-tools in 2023
- Wat is de AI-maturiteitsanalyse van het bedrijf?
- AI voor B2B-personalisatie
- ChatGPT-toepassingen. 18 voorbeelden van hoe je je bedrijf in 2024 kunt verbeteren met ChatGPT
- AI Mockup-generator. Top 4 tools
- Microlearning. Een snelle manier om nieuwe vaardigheden te leren
- De meest interessante AI-implementaties in bedrijven in 2024
- Welke uitdagingen brengt het AI-project met zich mee?
- Top 8 AI-tools voor bedrijven in 2024
- AI in CRM. Wat verandert AI in CRM-tools?
- De EU AI-wet. Hoe reguleert Europa het gebruik van kunstmatige intelligentie
- Top 7 AI websitebouwers
- No-code tools en AI-innovaties
- Hoeveel verhoogt het gebruik van AI de productiviteit van je team?
- Hoe ChatGTP te gebruiken voor marktonderzoek?
- Hoe de reikwijdte van je AI-marketingcampagne te verbreden?
- AI in transport en logistiek
- Welke zakelijke pijnpunten kan AI oplossen?
- Hoe koppel je een AI-oplossing aan een zakelijk probleem?
- Kunstmatige intelligentie in de media
- AI in bankieren en financiën. Stripe, Monzo en Grab
- AI in de reisindustrie
- Hoe AI de geboorte van nieuwe technologieën bevordert
- AI in e-commerce. Overzicht van wereldwijde leiders
- Top 4 AI afbeeldingscreatietools
- Top 5 AI-tools voor data-analyse
- De revolutie van AI in sociale media
- Is het altijd de moeite waard om kunstmatige intelligentie toe te voegen aan het productontwikkelingsproces?
- 6 grootste zakelijke blunders veroorzaakt door AI
- AI-strategie in uw bedrijf - hoe bouw je het op?
- Beste AI-cursussen – 6 geweldige aanbevelingen
- Social media luisteren optimaliseren met AI-tools
- IoT + AI, of hoe energie kosten in een bedrijf te verlagen
- AI in logistiek. 5 beste tools
- GPT Store – een overzicht van de meest interessante GPT's voor bedrijven
- LLM, GPT, RAG... Wat betekenen AI-acroniemen?
- AI-robots – de toekomst of het heden van het bedrijfsleven?
- Wat zijn de kosten van het implementeren van AI in een bedrijf?
- Wat doen specialisten in kunstmatige intelligentie?
- Hoe kan AI helpen in de carrière van een freelancer?
- Automatiseren van werk en het verhogen van de productiviteit. Een gids voor AI voor freelancers
- AI voor startups – beste tools
- Een website bouwen met AI
- Elf Labs en wat nog meer? De meest veelbelovende AI-startups
- OpenAI, Midjourney, Anthropic, Hugging Face. Wie is wie in de wereld van AI?
- Synthetische gegevens en het belang ervan voor de ontwikkeling van uw bedrijf
- Top AI-zoekmachines. Waar te zoeken naar AI-tools?
- Video AI. De nieuwste AI video generators
- AI voor managers. Hoe AI je werk gemakkelijker kan maken
- Wat is er nieuw in Google Gemini? Alles wat je moet weten
- AI in Polen. Bedrijven, vergaderingen en conferenties
- AI-kalender. Hoe optimaliseer je je tijd in een bedrijf?
- AI en de toekomst van werk. Hoe bereidt u uw bedrijf voor op verandering?
- AI-stemklonen voor bedrijven. Hoe maak je gepersonaliseerde stemberichten met AI?
- "We zijn allemaal ontwikkelaars". Hoe kunnen burgerontwikkelaars uw bedrijf helpen?
- Feitencontrole en AI-hallucinaties
- AI in werving – wervingsmaterialen stap voor stap ontwikkelen
- Sora. Hoe zullen realistische video's van OpenAI het bedrijfsleven veranderen?
- Midjourney v6. Innovaties in AI-beeldgeneratie
- AI in MKB's. Hoe kunnen MKB's concurreren met giganten met behulp van AI?
- Hoe verandert AI influencer marketing?
- Is AI echt een bedreiging voor ontwikkelaars? Devin en Microsoft AutoDev
- Beste AI-chatbots voor e-commerce. Platforms
- AI-chatbots voor e-commerce. Casestudy's
- Hoe blijf je op de hoogte van wat er gaande is in de AI-wereld?
- AI temmen. Hoe de eerste stappen te zetten om AI in uw bedrijf toe te passen?
- Perplexity, Bing Copilot of You.com? Vergelijking van AI-zoekmachines
- AI-experts in Polen
- ReALM. Een baanbrekend taalmodel van Apple?
- Google Genie — een generatief AI-model dat volledig interactieve werelden uit afbeeldingen creëert
- Automatisering of augmentatie? Twee benaderingen van AI in een bedrijf
- LLMOps, of hoe taalmodellen effectief te beheren in een organisatie
- AI-video generatie. Nieuwe horizonten in videoinhoudproductie voor bedrijven
- Beste AI-transcriptietools. Hoe lange opnames om te zetten in beknopte samenvattingen?
- Sentimentanalyse met AI. Hoe helpt het veranderingen in bedrijven te stimuleren?
- De rol van AI in contentmoderatie