Před několika dny Google opět upoutal pozornost nadšenců do AI oznámením Gemini 1.5 jen týden po vydání výkonného modelu Gemini 1.0 Ultra a přejmenování chatbotu Bard na Gemini.

Nicméně OpenAI nenechal Google užívat si silnou pozici v oblasti AI ani na den. Tvůrci ChatGPT odhalili ještě vzrušujícíjší řešení: Sora, generátor videí schopný vytvářet téměř minutová videa na základě textových podnětů. OpenAI’s Sora má potenciál stát se revolučním nástrojem, který může změnit průmysl tvorby video obsahu. To, co dělá Sorou výjimečnou, však nejsou jen její technické schopnosti, ale také široká škála potenciálních aplikací – od marketingu a vzdělávání po zábavní průmysl a každodenní komunikaci. Pojďme prozkoumat, jak Sora hodlá přinést tyto změny a jaké vyhlídky otevírá pro podniky.

Sora od OpenAI – nová éra v tvorbě video obsahu

Ušli jsme dlouhou cestu od prvních neohrabaných pokusů o vytváření videí pomocí počítačů. Již je zřejmé, že videa vytvořená generativní umělou inteligencí, i ta stará jen šest měsíců, vypadají ve srovnání se Sora generacemi docela neohrabaně. Ačkoli Sora, která dokáže vytvářet realistické video scény na základě textových instrukcí, je stále ve fázi experimentování a zatím není veřejně dostupná, její schopnosti jsou ohromující.

Sora nabízí širokou škálu aplikací, které mohou změnit způsob, jakým vytváříme a konzumujeme video obsah. Zde je několik příkladů:

  • generování složitých scén s více postavami nebo objekty,
  • animace již existujících obrázků,
  • úprava vytvořených videí,
  • kombinování různých grafik nebo videí do jednoho.

Tyto příklady ukazují obrovský pokrok v oblasti AI. Nicméně především otevírají dveře novým možnostem v tvorbě video obsahu. Podívejte se na prezentaci videa ve vysokém rozlišení, které zobrazuje krásu kvetoucího květu:

Zdroj: OpenAI (https://cdn.openai.com/sora/videos/flower-blooming.mp4 nebo https://youtu.be/UNmqxZoTgsk)

Jak bude Sora používána?

Je Sora jen hračkou a dalším nástrojem pro vytváření video obsahu? Ne. Minimálně podle OpenAI. Jak tvůrci Sory píší:

Učíme umělou inteligenci chápat a simulovat fyzický svět v pohybu, a cílem je trénovat modely, které pomáhají lidem řešit problémy vyžadující interakci s reálným světem.

Aby model přesně generoval videa, musí chápat svět na mnohem hlubší úrovni, než je potřeba pro vytváření textu. To zahrnuje porozumění fyzice, prostorovým vztahům mezi objekty na stejné rovině a interakci mezi popředím a pozadím.

Sora bude schopna generovat:

  • video z textu – první a nejdůležitější inovace modelu,
  • video z obrázků – umožňující animaci existujících generací vytvořených v DALL·E 3,
  • video z obrázku a textu – umožňující přesnější tvorbu filmů,
  • video z videa – přidávání speciálních efektů, prodlužování filmu, kombinování dvou existujících záznamů nebo změna stylu videa,
  • obrázky z textu – pravděpodobně nakonec nahradí DALL·E a nabídne generace s rozlišením 2048×2048.

V budoucnu by Sora mohla být použita k vytváření propagačních videí, obsahu pro sociální média nebo obchodních prezentací. Je to nástroj, který by mohl zcela změnit způsob, jakým vytváříme a sdílíme video obsah:

Zdroj: OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 nebo https://youtu.be/3l8wjxjNubE)

Ačkoli tento kolosální krok ve vývoji generativní umělé inteligence je vzrušující, také vyvolává obavy ohledně rizik spojených s deep fakes, zejména ve vztahu k prezidentským volbám v USA. Hrozby spojené s používáním Sory zahrnují především:

  • Dezinformace. Deepfakes, včetně fotorealistických videí generovaných Sorou, mohou šířit falešné zprávy, které mohou ovlivnit veřejné mínění a podkopat demokracii. Vytvářením falešných videí, která vypadají skutečně, mohou být diváci manipulováni a podváděni.
  • Porušení soukromí. Zpřístupnění Sory by umožnilo komukoli s počítačem a přístupem na internet vytvářet falešný obsah, včetně videí, která porušují soukromí a zneužívají osobní údaje bez povolení. Pravděpodobně z tohoto důvodu potrvá nějakou dobu, než bude Sora dostupná široké veřejnosti. OpenAI musí zajistit vhodná ochranná opatření.
  • Poškození pověsti. Pomocí Sory mohou hackeři napodobovat jiné jednotlivce, organizace nebo značky, aby je očernili. Vytvářením dojmu, že někdo říká nebo dělá věci, které nikdy neudělal, mohou taková videa výrazně poškodit pověst a důvěryhodnost. Kombinace technologie deepfake s AI založeným klonováním hlasu může bohužel vést k vytvoření mnoha vysoce přesvědčivých falešných záznamů. Jak se blížíme k bodu, kdy je rozlišení falešného záznamu od skutečného extrémně obtížné, bdělost, povědomí a kritické myšlení se stávají stále důležitějšími v boji proti potenciálnímu poškození způsobenému deepfakes.

Proto, i když jsou schopnosti Sory ohromující, musíme být opatrní ohledně jejich dopadu na společnost, vytvářet regulace a podniknout další kroky k minimalizaci jejich negativních důsledků.

Jak používat Sorou?

Ačkoli je Sora v současnosti ve fázi testování a není dostupná širšímu publiku, používání se zdá být jednoduchým a intuitivním procesem. Uživatelé ji pravděpodobně budou moci používat tak, jak nyní používají DALL-E 3 v ChatGPT Plus. To znamená, že budou psát textové příkazy, které Sora převede na krátké video klipy. To nabízí nové příležitosti pro tvůrce obsahu, marketéry a pedagogy, což jim umožní rychle vytvářet atraktivní, vysoce kvalitní videa.

Jak se Sora srovnává s jinými generátory videí AI?

Ale jak se Sora srovnává s jinými generátory videí? Zatím můžeme pouze spekulovat, jak si Sora povede, ale na základě popisu nástroje dostupného na webových stránkách OpenAI můžeme učinit několik obecných pozorování:

  • Runway – Sora bude fungovat podobně, ale s mnohem vyšší realističností. Runway vám umožňuje vytvářet video a obrazový obsah pomocí AI, včetně možností text-to-video a image-to-image. Také nabízí vylepšení úprav, jako je odstranění pozadí a nahrazení prvků na základě textových příkazů.
  • Synthesia – platforma funguje jinak než Sora, protože nabízí vytváření realistických videí s digitálními avatary, podporujícími více než 120 jazyků a umožňujícími vytváření vlastních avatarů. Zatím nevíme, jak si Sora poradí s úkoly, jako je kombinování zvuku nebo generování řeči s vizuálním materiálem, který vytváří.
  • HeyGen – její jedinečnost spočívá v klonování hlasu a schopnosti vytvářet avatar s vlastním gestem, takže její funkčnost se výrazně liší od nabídky Sory.
  • Stable Video Diffusion – pravděpodobně nejvážnější přímý konkurent Sory, schopný proměnit statické obrázky na video animace, zejména pro tvůrce obsahu na sociálních médiích. Její experimentální povaha a skutečnost, že je založena na modelech s otevřeným přístupem, vzbuzují velká očekávání v kontextu filmové produkce a animace.

Sora se liší od ostatních nástrojů pro generování videí, protože vytváří vysoce realistická videa, která se blíží skutečným záznamům. Rozlišení je zde obzvlášť důležité. Sora dokáže vytvářet videa s rozlišením až 1920x1080px.

Se svým hlubokým porozuměním jazyku model přesně interpretuje příkazy. Zde OpenAI použil metodu osvědčenou v DALL-E 3. Model nejprve interpretuje jednoduchý podnět zadaný uživatelem a poté generuje vizuální obsah na základě jeho propracované a podrobné verze. To mu umožňuje vytvářet složité scény a generovat postavy, které vyjadřují autentické emoce:

Zdroj: OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 nebo https://youtu.be/pxkfUDoQg5I)

Jak může Sora ovlivnit kreativní průmysl?

Potenciál Sory transformovat kreativní průmysl je obrovský. Přístup k tomuto nástroji pro filmaře a designéry přináší novou kvalitu do tvorby video obsahu. Sora slouží jako základ pro modely schopné simulovat reálný svět, což by mohlo být průlomem v dosažení AGI (Umělá obecná inteligence). Minimálně to tvrdí její tvůrci, OpenAI.

Jelikož Sora vytváří realistické pohyblivé obrázky podobné těm, které byly natočeny lidskou rukou, má potenciál výrazně změnit oblast tvorby videí, od školících materiálů po hollywoodské produkce. Sora nepochybně ovlivní:

  • Marketing. Sora má potenciál revolucionalizovat reklamní kampaně rychlým generováním atraktivního video obsahu na základě marketingových zpráv nebo popisů produktů.
  • Zábavní průmysl. Filmová studia a tvůrci obsahu mohou těžit z Sory schopnosti vytvářet realistické scény a postavy, což zjednodušuje výrobní procesy.
  • Hry. Vývojáři her mohou použít Sorou k vytváření filmů nebo trailerů uvnitř her, což zlepší zážitky hráčů.
  • Školení. Snadnost vytváření vysoce kvalitních vzdělávacích materiálů, včetně “jak na to” instruktážních videí, může výrazně zvýšit atraktivitu školení a kurzů.
sora

Zdroj: DALL·E 3, podnět: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Jak mohou společnosti těžit z realistického AI videa?

Použití AI ve výrobě videí nabízí společnostem řadu výhod, jako jsou úspory času a nákladů, konzistentní kvalita výsledků a zvýšení hodnoty konečného produktu. OpenAI podniká kroky k zajištění bezpečnosti Sory, včetně spolupráce s týmy pro testování proti zneužití a vývoje klasifikátoru pro detekci videí generovaných AI.

Sora od OpenAI otevírá nové možnosti pro vytváření a konzumaci video obsahu. Od revolucionalizace kreativního průmyslu po ovlivnění marketingu a vzdělávání, až po vliv na každodenní komunikaci – potenciál je obrovský. Jako nástroj, který může zcela změnit pravidla hry, si Sora zaslouží zvláštní pozornost. Těšíme se na další informace od OpenAI, zejména ohledně toho, kdy bude Sora dostupná širší veřejnosti. To znamená začátek nové éry v tvorbě video obsahu. Dalším krokem je její integrace se zvukem, hlasem a 3D modely, což otevře dveře do metaverza.

Sora OpenAI

Pokud se vám náš obsah líbí, připojte se k naší komunitě pilných včel na Facebooku, Twitteru, LinkedInu, Instagramu, YouTube, Pinterestu, TikToku.

Robert Whitney

Odborník na JavaScript a lektor, který školí IT oddělení. Jeho hlavním cílem je zvýšit produktivitu týmu tím, že učí ostatní, jak efektivně spolupracovat při programování.

View all posts →

AI in business:

  1. 6 úžasných pluginů ChatGTP, které vám usnadní život
  2. Navigace novými obchodními příležitostmi s ChatGPT-4
  3. 3 úžasní autoři AI, které musíte dnes vyzkoušet
  4. Syntetické herečky. Top 3 generátory videa s AI
  5. Jaké jsou slabiny mé podnikatelské myšlenky? Brainstormingová seance s ChatGPT
  6. Používání ChatGPT v podnikání
  7. Nové služby a produkty fungující s umělou inteligencí
  8. Automatizované příspěvky na sociálních médiích
  9. Plánování příspěvků na sociálních médiích. Jak může AI pomoci?
  10. Role AI v rozhodování v podnikání
  11. Obchodní NLP dnes a zítra
  12. AI-podporované textové chatboty
  13. Aplikace AI v podnikání - přehled
  14. Hrozby a příležitosti AI v podnikání (část 2)
  15. Hrozby a příležitosti AI v podnikání (část 1)
  16. Jaká je budoucnost AI podle McKinsey Global Institute?
  17. Umělá inteligence v podnikání - Úvod
  18. Co je NLP, neboli zpracování přirozeného jazyka v podnikání
  19. Google Translate vs DeepL. 5 aplikací strojového překladu pro podnikání
  20. Automatické zpracování dokumentů
  21. Provoz a obchodní aplikace hlasových botů
  22. Technologie virtuálních asistentů, nebo jak mluvit s AI?
  23. Co je to Business Intelligence?
  24. Jak může umělá inteligence pomoci s BPM?
  25. Kreativní AI dneška a zítřka
  26. Umělá inteligence v řízení obsahu
  27. Zkoumání síly AI v tvorbě hudby
  28. 3 užitečné nástroje pro grafický design s umělou inteligencí. Generativní AI v podnikání
  29. AI a sociální média – co o nás říkají?
  30. Nahradí umělá inteligence business analytiky?
  31. Nástroje AI pro manažera
  32. Budoucí trh práce a nadcházející profese
  33. RPA a API v digitální společnosti
  34. Nové interakce. Jak umělá inteligence mění způsob, jakým ovládáme zařízení?
  35. Multimodální AI a její aplikace v podnikání
  36. Umělá inteligence a životní prostředí. 3 řešení AI, která vám pomohou vybudovat udržitelné podnikání
  37. Detektory obsahu AI. Stojí to za to?
  38. ChatGPT vs Bard vs Bing. Který AI chatbot vede závod?
  39. Je chatbot AI konkurentem vyhledávání Google?
  40. Efektivní ChatGPT výzvy pro HR a nábor
  41. Inženýrství promptů. Co dělá inženýr promptů?
  42. AI a co dál? Hlavní technologické trendy pro podnikání v roce 2024
  43. AI a obchodní etika. Proč byste měli investovat do etických řešení
  44. Meta AI. Co byste měli vědět o funkcích podporovaných AI na Facebooku a Instagramu?
  45. Regulace AI. Co potřebujete vědět jako podnikatel?
  46. 5 nových využití AI v podnikání
  47. AI produkty a projekty - čím se liší od ostatních?
  48. AI jako expert ve vašem týmu
  49. AI tým vs. rozdělení rolí
  50. Jak si vybrat obor kariéry v AI?
  51. AI v HR: Jak automatizace náboru ovlivňuje HR a rozvoj týmu
  52. Automatizace procesů s asistencí AI. Kde začít?
  53. 6 nejzajímavějších nástrojů AI v roce 2023
  54. Jaká je analýza zralosti AI společnosti?
  55. AI pro B2B personalizaci
  56. Případy použití ChatGPT. 18 příkladů, jak v roce 2024 zlepšit své podnikání s ChatGPT
  57. Generátor AI maket. Nejlepší 4 nástroje
  58. Mikrolearning. Rychlý způsob, jak získat nové dovednosti
  59. Nejzajímavější implementace AI ve firmách v roce 2024
  60. Jaké výzvy přináší projekt AI?
  61. Top 8 AI nástrojů pro podnikání v roce 2024
  62. AI v CRM. Co AI mění v nástrojích CRM?
  63. Akt o umělé inteligenci EU. Jak Evropa reguluje používání umělé inteligence
  64. Top 7 AI tvůrců webových stránek
  65. Nástroje bez kódu a inovace AI
  66. Kolik zvyšuje používání AI produktivitu vašeho týmu?
  67. Jak používat ChatGTP pro průzkum trhu?
  68. Jak rozšířit dosah vaší AI marketingové kampaně?
  69. AI v dopravě a logistice
  70. Jaké obchodní problémy může AI vyřešit?
  71. Jak sladit řešení AI s obchodním problémem?
  72. Umělá inteligence v médiích
  73. AI v bankovnictví a financích. Stripe, Monzo a Grab
  74. AI v cestovním průmyslu
  75. Jak umělá inteligence podporuje vznik nových technologií
  76. AI v e-commerce. Přehled globálních lídrů
  77. Top 4 nástroje pro vytváření obrázků pomocí AI
  78. Top 5 nástrojů AI pro analýzu dat
  79. Revoluce AI v sociálních médiích
  80. Je vždy výhodné přidávat umělou inteligenci do procesu vývoje produktu?
  81. 6 největších obchodních neúspěchů způsobených AI
  82. AI strategie ve vaší společnosti - jak ji vybudovat?
  83. Nejlepší kurzy AI – 6 skvělých doporučení
  84. Optimalizace sledování sociálních médií pomocí nástrojů AI
  85. IoT + AI, nebo jak snížit náklady na energii ve firmě
  86. AI v logistice. 5 nejlepších nástrojů
  87. GPT Store – přehled nejzajímavějších GPT pro podnikání
  88. LLM, GPT, RAG... Co znamenají zkratky AI?
  89. AI roboti – budoucnost nebo přítomnost podnikání?
  90. Jaké jsou náklady na implementaci AI ve společnosti?
  91. Co dělají specialisté na umělou inteligenci?
  92. Jak může AI pomoci v kariéře freelancera?
  93. Automatizace práce a zvyšování produktivity. Příručka pro AI pro freelancery
  94. AI pro startupy – nejlepší nástroje
  95. Vytváření webové stránky s AI
  96. Jedenáct laboratoří a co dál? Nejperspektivnější startupy v oblasti AI
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Kdo je kdo ve světě AI?
  98. Syntetická data a jejich význam pro rozvoj vašeho podnikání
  99. Nejlepší vyhledávače AI. Kde hledat nástroje AI?
  100. Video AI. Nejnovější generátory videí s umělou inteligencí
  101. AI pro manažery. Jak může AI usnadnit vaši práci
  102. Co je nového v Google Gemini? Vše, co potřebujete vědět
  103. AI v Polsku. Firmy, setkání a konference
  104. AI kalendář. Jak optimalizovat svůj čas ve firmě?
  105. AI a budoucnost práce. Jak připravit svou firmu na změnu?
  106. AI hlasové klonování pro podnikání. Jak vytvořit personalizované hlasové zprávy s AI?
  107. "Všichni jsme vývojáři." Jak mohou občanští vývojáři pomoci vaší společnosti?
  108. Ověřování faktů a halucinace AI
  109. AI v náboru – vývoj náborových materiálů krok za krokem
  110. Sora. Jak změní realistická videa od OpenAI podnikání?
  111. Midjourney v6. Inovace v generování obrazů pomocí AI
  112. AI v malých a středních podnicích. Jak mohou malé a střední podniky soutěžit s obry pomocí AI?
  113. Jak umělá inteligence mění marketing influencerů?
  114. Je AI skutečně hrozbou pro vývojáře? Devin a Microsoft AutoDev
  115. Nejlepší AI chatboty pro e-commerce. Platformy
  116. AI chatboti pro e-commerce. Případové studie
  117. Jak zůstat v obraze o tom, co se děje ve světě AI?
  118. Ovládání AI. Jak udělat první kroky k aplikaci AI ve vašem podnikání?
  119. Perplexity, Bing Copilot nebo You.com? Porovnání AI vyhledávačů
  120. AI experti v Polsku
  121. ReALM. Průlomový jazykový model od Applu?
  122. Google Genie — generativní AI model, který vytváří plně interaktivní světy z obrázků
  123. Automatizace nebo augmentace? Dva přístupy k AI ve společnosti
  124. LLMOps, neboli jak efektivně spravovat jazykové modely v organizaci
  125. Generování videa pomocí AI. Nové obzory ve výrobě video obsahu pro podniky
  126. Nejlepší nástroje pro přepisování pomocí AI. Jak převést dlouhé nahrávky na stručné shrnutí?
  127. Analýza sentimentu pomocí AI. Jak pomáhá řídit změny v podnikání?
  128. Role AI v moderaci obsahu