ReALM – obsah
Co je ReALM?
ReALM znamená “Reference Resolution As Language Modeling,” průlomové řešení vyvinuté výzkumníky společnosti Apple. Je to tedy nový jazykový model (Large Language Model, LLM), který považuje problém rozpoznávání referencí za úkol v oblasti jazykového modelování.
ReALM efektivně převádí různé typy kontextu na textovou reprezentaci, kterou poté zpracovává jako součást jazykového úkolu. To může zahrnovat:
- konverzace – jako jsou textové zprávy, hlasové příkazy asistentovi nebo e-maily,
- prvky na obrazovce – například fotografie, kalendář, widget počasí nebo aplikace a procesy běžící na pozadí.
Co dělá ReALM odlišným od ostatních modelů rozpoznávání referencí? Především přístup – místo spoléhání se na zpracování obrazu, ReALM funguje v textové doméně. To jej činí mnohem lehčím a efektivnějším, což by mělo umožnit jeho provoz přímo na mobilních zařízeních při zachování soukromí uživatelů.
V čem je ReALM lepší než GPT-4?
Výzkumný tým společnosti Apple porovnal ReALM s nejvýkonnějšími jazykovými modely na trhu dnes – GPT-3.5 a GPT-4 od OpenAI. Výsledky byly působivé. V úlohách rozpoznávání referencí dosáhla nejmenší varianta ReALM přesnosti srovnatelné s GPT-4! Větší modely ReALM dokonce překonaly GPT-4 v rozpoznávání referencí na položky zobrazené na obrazovce (http://arxiv.org/abs/2403.20329).
Co vysvětluje tuto výhodu? Především, ReALM je skvělý s dotazy specifickými pro doménu, jako jsou ty, které se týkají chytrých domácích spotřebičů. To je způsobeno tím, že ReALM prokazuje hlubší porozumění kontextu tím, že model jemně ladí pro data specifická pro doménu.
Co víc, na rozdíl od GPT-4, který se primárně trénuje na obrázcích skutečných objektů, ReALM vyniká v rozpoznávání textových prvků a komponent uživatelských rozhraní aplikací. A porozumění rozhraní je klíčové pro plynulou interakci hlasových asistentů s aplikacemi, které dnes používáme.

Zdroj: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
Je to začátek éry skutečně inteligentních asistentů?
Opravdu, integrace ReALM se Siri by mohla otevřít zcela novou kapitolu v interakci člověka s počítačem. S ReALM bude Siri schopna rozumět příkazům, které zahrnují odkazy na položky zobrazené na obrazovce smartphonu, stejně jako procesy a aplikace běžící na pozadí. Ale kdy bude tato možnost dostupná uživatelům? To je stále neznámé.
Zůstáváme s spekulacemi založenými na technických schopnostech modelu. Jak by tedy mohla fungovat Siri poháněná ReALM? Například, pokud procházíte webovou stránku s firemními seznamy a vidíte společnost, o kterou máte zájem, můžete jednoduše říct Siri: “Zavolej tuto společnost,” a asistent – využívající ReALM k analýze kontextu – najde telefonní číslo společnosti, kterou specifikujete, a zahájí hovor. Ani nemusíte vysvětlovat, kterou společnost máte na mysli.
A to je teprve začátek možností ReALM. Příkazy jako „Přehrát poslední playlist“ by umožnily intuitivní ovládání multimediálních aplikací a zařízení chytré domácnosti. ReALM by také mohl umožnit Siri rozumět kontextu konverzací a historii příkazů, aby asistent reagoval adekvátně na předchozí požadavky uživatele. To je krok směrem k inteligentním agentům, který nás přibližuje nejen k umělé inteligenci, která rozumí našim dotazům, ale k takové, která bude umět realizovat příkazy.
A to je teprve začátek toho, co ReALM může udělat. Příkazy jako “přehrát poslední playlist” by umožnily intuitivní ovládání multimediálních aplikací a zařízení chytré domácnosti. ReALM by také mohl umožnit Siri rozumět kontextu konverzací a historii příkazů, aby asistent reagoval adekvátně na předchozí požadavky uživatele. To je krok směrem k inteligentním agentům, který nás přibližuje k umělé inteligenci, která rozumí našim požadavkům, ale také ví, jak vykonávat příkazy.
Bohužel, uživatelé zařízení Android budou muset počkat. V současnosti nejsou žádné informace o plánech společnosti Google přidat schopnosti Gemini do Google Assistant. Aplikace Google Gemini pro zařízení Android byla vyvinuta (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), ale zatím není dostupná mimo Spojené státy.

Zdroj: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)
Shrnutí
ReALM je inovativní přístup společnosti Apple k řešení problému rozpoznávání kontextu hlasovými asistenty. Místo spoléhání se na zpracování obrazu tento jazykový model převádí různé typy kontextu na textovou reprezentaci, kterou poté zpracovává v jazykovém úkolu. Tento přístup zajišťuje nejen vysokou přesnost rozpoznávání, ale také schopnost fungovat na mobilním zařízení při zachování soukromí uživatelů.
Poskytnutí přístupu Siri k ReALM může poskytnout přirozenější a kontextuální hlasové interakce, což je důležitý krok směrem k skutečně inteligentním asistentům. S ReALM bude Siri schopna okamžitě reagovat na příkazy týkající se položek na obrazovce, aplikací a procesů na pozadí. Jedna věc je jistá – zlepšení kontextového povědomí asistentů je klíčem k vytvoření skutečně inteligentních a přirozených hlasových interakcí, a ReALM je bezpochyby důležitým krokem tímto směrem.

Pokud se vám náš obsah líbí, připojte se k naší komunitě pilných včel na Facebooku, Twitteru, LinkedInu, Instagramu, YouTube, Pinterestu, TikToku.
Robert Whitney
Odborník na JavaScript a lektor, který školí IT oddělení. Jeho hlavním cílem je zvýšit produktivitu týmu tím, že učí ostatní, jak efektivně spolupracovat při programování.
AI in business:
- 6 úžasných pluginů ChatGTP, které vám usnadní život
- Navigace novými obchodními příležitostmi s ChatGPT-4
- 3 úžasní autoři AI, které musíte dnes vyzkoušet
- Syntetické herečky. Top 3 generátory videa s AI
- Jaké jsou slabiny mé podnikatelské myšlenky? Brainstormingová seance s ChatGPT
- Používání ChatGPT v podnikání
- Nové služby a produkty fungující s umělou inteligencí
- Automatizované příspěvky na sociálních médiích
- Plánování příspěvků na sociálních médiích. Jak může AI pomoci?
- Role AI v rozhodování v podnikání
- Obchodní NLP dnes a zítra
- AI-podporované textové chatboty
- Aplikace AI v podnikání - přehled
- Hrozby a příležitosti AI v podnikání (část 2)
- Hrozby a příležitosti AI v podnikání (část 1)
- Jaká je budoucnost AI podle McKinsey Global Institute?
- Umělá inteligence v podnikání - Úvod
- Co je NLP, neboli zpracování přirozeného jazyka v podnikání
- Google Translate vs DeepL. 5 aplikací strojového překladu pro podnikání
- Automatické zpracování dokumentů
- Provoz a obchodní aplikace hlasových botů
- Technologie virtuálních asistentů, nebo jak mluvit s AI?
- Co je to Business Intelligence?
- Jak může umělá inteligence pomoci s BPM?
- Kreativní AI dneška a zítřka
- Umělá inteligence v řízení obsahu
- Zkoumání síly AI v tvorbě hudby
- 3 užitečné nástroje pro grafický design s umělou inteligencí. Generativní AI v podnikání
- AI a sociální média – co o nás říkají?
- Nahradí umělá inteligence business analytiky?
- Nástroje AI pro manažera
- Budoucí trh práce a nadcházející profese
- RPA a API v digitální společnosti
- Nové interakce. Jak umělá inteligence mění způsob, jakým ovládáme zařízení?
- Multimodální AI a její aplikace v podnikání
- Umělá inteligence a životní prostředí. 3 řešení AI, která vám pomohou vybudovat udržitelné podnikání
- Detektory obsahu AI. Stojí to za to?
- ChatGPT vs Bard vs Bing. Který AI chatbot vede závod?
- Je chatbot AI konkurentem vyhledávání Google?
- Efektivní ChatGPT výzvy pro HR a nábor
- Inženýrství promptů. Co dělá inženýr promptů?
- AI a co dál? Hlavní technologické trendy pro podnikání v roce 2024
- AI a obchodní etika. Proč byste měli investovat do etických řešení
- Meta AI. Co byste měli vědět o funkcích podporovaných AI na Facebooku a Instagramu?
- Regulace AI. Co potřebujete vědět jako podnikatel?
- 5 nových využití AI v podnikání
- AI produkty a projekty - čím se liší od ostatních?
- AI jako expert ve vašem týmu
- AI tým vs. rozdělení rolí
- Jak si vybrat obor kariéry v AI?
- AI v HR: Jak automatizace náboru ovlivňuje HR a rozvoj týmu
- Automatizace procesů s asistencí AI. Kde začít?
- 6 nejzajímavějších nástrojů AI v roce 2023
- Jaká je analýza zralosti AI společnosti?
- AI pro B2B personalizaci
- Případy použití ChatGPT. 18 příkladů, jak v roce 2024 zlepšit své podnikání s ChatGPT
- Generátor AI maket. Nejlepší 4 nástroje
- Mikrolearning. Rychlý způsob, jak získat nové dovednosti
- Nejzajímavější implementace AI ve firmách v roce 2024
- Jaké výzvy přináší projekt AI?
- Top 8 AI nástrojů pro podnikání v roce 2024
- AI v CRM. Co AI mění v nástrojích CRM?
- Akt o umělé inteligenci EU. Jak Evropa reguluje používání umělé inteligence
- Top 7 AI tvůrců webových stránek
- Nástroje bez kódu a inovace AI
- Kolik zvyšuje používání AI produktivitu vašeho týmu?
- Jak používat ChatGTP pro průzkum trhu?
- Jak rozšířit dosah vaší AI marketingové kampaně?
- AI v dopravě a logistice
- Jaké obchodní problémy může AI vyřešit?
- Jak sladit řešení AI s obchodním problémem?
- Umělá inteligence v médiích
- AI v bankovnictví a financích. Stripe, Monzo a Grab
- AI v cestovním průmyslu
- Jak umělá inteligence podporuje vznik nových technologií
- AI v e-commerce. Přehled globálních lídrů
- Top 4 nástroje pro vytváření obrázků pomocí AI
- Top 5 nástrojů AI pro analýzu dat
- Revoluce AI v sociálních médiích
- Je vždy výhodné přidávat umělou inteligenci do procesu vývoje produktu?
- 6 největších obchodních neúspěchů způsobených AI
- AI strategie ve vaší společnosti - jak ji vybudovat?
- Nejlepší kurzy AI – 6 skvělých doporučení
- Optimalizace sledování sociálních médií pomocí nástrojů AI
- IoT + AI, nebo jak snížit náklady na energii ve firmě
- AI v logistice. 5 nejlepších nástrojů
- GPT Store – přehled nejzajímavějších GPT pro podnikání
- LLM, GPT, RAG... Co znamenají zkratky AI?
- AI roboti – budoucnost nebo přítomnost podnikání?
- Jaké jsou náklady na implementaci AI ve společnosti?
- Co dělají specialisté na umělou inteligenci?
- Jak může AI pomoci v kariéře freelancera?
- Automatizace práce a zvyšování produktivity. Příručka pro AI pro freelancery
- AI pro startupy – nejlepší nástroje
- Vytváření webové stránky s AI
- Jedenáct laboratoří a co dál? Nejperspektivnější startupy v oblasti AI
- OpenAI, Midjourney, Anthropic, Hugging Face. Kdo je kdo ve světě AI?
- Syntetická data a jejich význam pro rozvoj vašeho podnikání
- Nejlepší vyhledávače AI. Kde hledat nástroje AI?
- Video AI. Nejnovější generátory videí s umělou inteligencí
- AI pro manažery. Jak může AI usnadnit vaši práci
- Co je nového v Google Gemini? Vše, co potřebujete vědět
- AI v Polsku. Firmy, setkání a konference
- AI kalendář. Jak optimalizovat svůj čas ve firmě?
- AI a budoucnost práce. Jak připravit svou firmu na změnu?
- AI hlasové klonování pro podnikání. Jak vytvořit personalizované hlasové zprávy s AI?
- "Všichni jsme vývojáři." Jak mohou občanští vývojáři pomoci vaší společnosti?
- Ověřování faktů a halucinace AI
- AI v náboru – vývoj náborových materiálů krok za krokem
- Sora. Jak změní realistická videa od OpenAI podnikání?
- Midjourney v6. Inovace v generování obrazů pomocí AI
- AI v malých a středních podnicích. Jak mohou malé a střední podniky soutěžit s obry pomocí AI?
- Jak umělá inteligence mění marketing influencerů?
- Je AI skutečně hrozbou pro vývojáře? Devin a Microsoft AutoDev
- Nejlepší AI chatboty pro e-commerce. Platformy
- AI chatboti pro e-commerce. Případové studie
- Jak zůstat v obraze o tom, co se děje ve světě AI?
- Ovládání AI. Jak udělat první kroky k aplikaci AI ve vašem podnikání?
- Perplexity, Bing Copilot nebo You.com? Porovnání AI vyhledávačů
- AI experti v Polsku
- ReALM. Průlomový jazykový model od Applu?
- Google Genie — generativní AI model, který vytváří plně interaktivní světy z obrázků
- Automatizace nebo augmentace? Dva přístupy k AI ve společnosti
- LLMOps, neboli jak efektivně spravovat jazykové modely v organizaci
- Generování videa pomocí AI. Nové obzory ve výrobě video obsahu pro podniky
- Nejlepší nástroje pro přepisování pomocí AI. Jak převést dlouhé nahrávky na stručné shrnutí?
- Analýza sentimentu pomocí AI. Jak pomáhá řídit změny v podnikání?
- Role AI v moderaci obsahu