Categories: AI v podnikáníBlog

Sora. Jak změní realistická videa od OpenAI podnikání? | AI v podnikání #94

Před několika dny Google opět upoutal pozornost nadšenců do AI oznámením Gemini 1.5 jen týden po vydání výkonného modelu Gemini 1.0 Ultra a přejmenování chatbotu Bard na Gemini.

Nicméně OpenAI nenechal Google užívat si silnou pozici v oblasti AI ani na den. Tvůrci ChatGPT odhalili ještě vzrušujícíjší řešení: Sora, generátor videí schopný vytvářet téměř minutová videa na základě textových podnětů. OpenAI’s Sora má potenciál stát se revolučním nástrojem, který může změnit průmysl tvorby video obsahu. To, co dělá Sorou výjimečnou, však nejsou jen její technické schopnosti, ale také široká škála potenciálních aplikací – od marketingu a vzdělávání po zábavní průmysl a každodenní komunikaci. Pojďme prozkoumat, jak Sora hodlá přinést tyto změny a jaké vyhlídky otevírá pro podniky.

Sora od OpenAI – nová éra v tvorbě video obsahu

Ušli jsme dlouhou cestu od prvních neohrabaných pokusů o vytváření videí pomocí počítačů. Již je zřejmé, že videa vytvořená generativní umělou inteligencí, i ta stará jen šest měsíců, vypadají ve srovnání se Sora generacemi docela neohrabaně. Ačkoli Sora, která dokáže vytvářet realistické video scény na základě textových instrukcí, je stále ve fázi experimentování a zatím není veřejně dostupná, její schopnosti jsou ohromující.

Sora nabízí širokou škálu aplikací, které mohou změnit způsob, jakým vytváříme a konzumujeme video obsah. Zde je několik příkladů:

  • generování složitých scén s více postavami nebo objekty,
  • animace již existujících obrázků,
  • úprava vytvořených videí,
  • kombinování různých grafik nebo videí do jednoho.

Tyto příklady ukazují obrovský pokrok v oblasti AI. Nicméně především otevírají dveře novým možnostem v tvorbě video obsahu. Podívejte se na prezentaci videa ve vysokém rozlišení, které zobrazuje krásu kvetoucího květu:

Zdroj: OpenAI (https://cdn.openai.com/sora/videos/flower-blooming.mp4 nebo https://youtu.be/UNmqxZoTgsk)

Jak bude Sora používána?

Je Sora jen hračkou a dalším nástrojem pro vytváření video obsahu? Ne. Minimálně podle OpenAI. Jak tvůrci Sory píší:

Učíme umělou inteligenci chápat a simulovat fyzický svět v pohybu, a cílem je trénovat modely, které pomáhají lidem řešit problémy vyžadující interakci s reálným světem.

Aby model přesně generoval videa, musí chápat svět na mnohem hlubší úrovni, než je potřeba pro vytváření textu. To zahrnuje porozumění fyzice, prostorovým vztahům mezi objekty na stejné rovině a interakci mezi popředím a pozadím.

Sora bude schopna generovat:

  • video z textu – první a nejdůležitější inovace modelu,
  • video z obrázků – umožňující animaci existujících generací vytvořených v DALL·E 3,
  • video z obrázku a textu – umožňující přesnější tvorbu filmů,
  • video z videa – přidávání speciálních efektů, prodlužování filmu, kombinování dvou existujících záznamů nebo změna stylu videa,
  • obrázky z textu – pravděpodobně nakonec nahradí DALL·E a nabídne generace s rozlišením 2048×2048.

V budoucnu by Sora mohla být použita k vytváření propagačních videí, obsahu pro sociální média nebo obchodních prezentací. Je to nástroj, který by mohl zcela změnit způsob, jakým vytváříme a sdílíme video obsah:

Zdroj: OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 nebo https://youtu.be/3l8wjxjNubE)

Ačkoli tento kolosální krok ve vývoji generativní umělé inteligence je vzrušující, také vyvolává obavy ohledně rizik spojených s deep fakes, zejména ve vztahu k prezidentským volbám v USA. Hrozby spojené s používáním Sory zahrnují především:

  • Dezinformace. Deepfakes, včetně fotorealistických videí generovaných Sorou, mohou šířit falešné zprávy, které mohou ovlivnit veřejné mínění a podkopat demokracii. Vytvářením falešných videí, která vypadají skutečně, mohou být diváci manipulováni a podváděni.
  • Porušení soukromí. Zpřístupnění Sory by umožnilo komukoli s počítačem a přístupem na internet vytvářet falešný obsah, včetně videí, která porušují soukromí a zneužívají osobní údaje bez povolení. Pravděpodobně z tohoto důvodu potrvá nějakou dobu, než bude Sora dostupná široké veřejnosti. OpenAI musí zajistit vhodná ochranná opatření.
  • Poškození pověsti. Pomocí Sory mohou hackeři napodobovat jiné jednotlivce, organizace nebo značky, aby je očernili. Vytvářením dojmu, že někdo říká nebo dělá věci, které nikdy neudělal, mohou taková videa výrazně poškodit pověst a důvěryhodnost. Kombinace technologie deepfake s AI založeným klonováním hlasu může bohužel vést k vytvoření mnoha vysoce přesvědčivých falešných záznamů. Jak se blížíme k bodu, kdy je rozlišení falešného záznamu od skutečného extrémně obtížné, bdělost, povědomí a kritické myšlení se stávají stále důležitějšími v boji proti potenciálnímu poškození způsobenému deepfakes.

Proto, i když jsou schopnosti Sory ohromující, musíme být opatrní ohledně jejich dopadu na společnost, vytvářet regulace a podniknout další kroky k minimalizaci jejich negativních důsledků.

Jak používat Sorou?

Ačkoli je Sora v současnosti ve fázi testování a není dostupná širšímu publiku, používání se zdá být jednoduchým a intuitivním procesem. Uživatelé ji pravděpodobně budou moci používat tak, jak nyní používají DALL-E 3 v ChatGPT Plus. To znamená, že budou psát textové příkazy, které Sora převede na krátké video klipy. To nabízí nové příležitosti pro tvůrce obsahu, marketéry a pedagogy, což jim umožní rychle vytvářet atraktivní, vysoce kvalitní videa.

Jak se Sora srovnává s jinými generátory videí AI?

Ale jak se Sora srovnává s jinými generátory videí? Zatím můžeme pouze spekulovat, jak si Sora povede, ale na základě popisu nástroje dostupného na webových stránkách OpenAI můžeme učinit několik obecných pozorování:

  • Runway – Sora bude fungovat podobně, ale s mnohem vyšší realističností. Runway vám umožňuje vytvářet video a obrazový obsah pomocí AI, včetně možností text-to-video a image-to-image. Také nabízí vylepšení úprav, jako je odstranění pozadí a nahrazení prvků na základě textových příkazů.
  • Synthesia – platforma funguje jinak než Sora, protože nabízí vytváření realistických videí s digitálními avatary, podporujícími více než 120 jazyků a umožňujícími vytváření vlastních avatarů. Zatím nevíme, jak si Sora poradí s úkoly, jako je kombinování zvuku nebo generování řeči s vizuálním materiálem, který vytváří.
  • HeyGen – její jedinečnost spočívá v klonování hlasu a schopnosti vytvářet avatar s vlastním gestem, takže její funkčnost se výrazně liší od nabídky Sory.
  • Stable Video Diffusion – pravděpodobně nejvážnější přímý konkurent Sory, schopný proměnit statické obrázky na video animace, zejména pro tvůrce obsahu na sociálních médiích. Její experimentální povaha a skutečnost, že je založena na modelech s otevřeným přístupem, vzbuzují velká očekávání v kontextu filmové produkce a animace.

Sora se liší od ostatních nástrojů pro generování videí, protože vytváří vysoce realistická videa, která se blíží skutečným záznamům. Rozlišení je zde obzvlášť důležité. Sora dokáže vytvářet videa s rozlišením až 1920x1080px.

Se svým hlubokým porozuměním jazyku model přesně interpretuje příkazy. Zde OpenAI použil metodu osvědčenou v DALL-E 3. Model nejprve interpretuje jednoduchý podnět zadaný uživatelem a poté generuje vizuální obsah na základě jeho propracované a podrobné verze. To mu umožňuje vytvářet složité scény a generovat postavy, které vyjadřují autentické emoce:

Zdroj: OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 nebo https://youtu.be/pxkfUDoQg5I)

Jak může Sora ovlivnit kreativní průmysl?

Potenciál Sory transformovat kreativní průmysl je obrovský. Přístup k tomuto nástroji pro filmaře a designéry přináší novou kvalitu do tvorby video obsahu. Sora slouží jako základ pro modely schopné simulovat reálný svět, což by mohlo být průlomem v dosažení AGI (Umělá obecná inteligence). Minimálně to tvrdí její tvůrci, OpenAI.

Jelikož Sora vytváří realistické pohyblivé obrázky podobné těm, které byly natočeny lidskou rukou, má potenciál výrazně změnit oblast tvorby videí, od školících materiálů po hollywoodské produkce. Sora nepochybně ovlivní:

  • Marketing. Sora má potenciál revolucionalizovat reklamní kampaně rychlým generováním atraktivního video obsahu na základě marketingových zpráv nebo popisů produktů.
  • Zábavní průmysl. Filmová studia a tvůrci obsahu mohou těžit z Sory schopnosti vytvářet realistické scény a postavy, což zjednodušuje výrobní procesy.
  • Hry. Vývojáři her mohou použít Sorou k vytváření filmů nebo trailerů uvnitř her, což zlepší zážitky hráčů.
  • Školení. Snadnost vytváření vysoce kvalitních vzdělávacích materiálů, včetně “jak na to” instruktážních videí, může výrazně zvýšit atraktivitu školení a kurzů.

Zdroj: DALL·E 3, podnět: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Jak mohou společnosti těžit z realistického AI videa?

Použití AI ve výrobě videí nabízí společnostem řadu výhod, jako jsou úspory času a nákladů, konzistentní kvalita výsledků a zvýšení hodnoty konečného produktu. OpenAI podniká kroky k zajištění bezpečnosti Sory, včetně spolupráce s týmy pro testování proti zneužití a vývoje klasifikátoru pro detekci videí generovaných AI.

Sora od OpenAI otevírá nové možnosti pro vytváření a konzumaci video obsahu. Od revolucionalizace kreativního průmyslu po ovlivnění marketingu a vzdělávání, až po vliv na každodenní komunikaci – potenciál je obrovský. Jako nástroj, který může zcela změnit pravidla hry, si Sora zaslouží zvláštní pozornost. Těšíme se na další informace od OpenAI, zejména ohledně toho, kdy bude Sora dostupná širší veřejnosti. To znamená začátek nové éry v tvorbě video obsahu. Dalším krokem je její integrace se zvukem, hlasem a 3D modely, což otevře dveře do metaverza.

Pokud se vám náš obsah líbí, připojte se k naší komunitě pilných včel na Facebooku, Twitteru, LinkedInu, Instagramu, YouTube, Pinterestu, TikToku.

Robert Whitney

Odborník na JavaScript a lektor, který školí IT oddělení. Jeho hlavním cílem je zvýšit produktivitu týmu tím, že učí ostatní, jak efektivně spolupracovat při programování.

View all posts →

Robert Whitney

Odborník na JavaScript a lektor, který školí IT oddělení. Jeho hlavním cílem je zvýšit produktivitu týmu tím, že učí ostatní, jak efektivně spolupracovat při programování.

Share
Published by
Robert Whitney

Recent Posts

Role AI v moderaci obsahu | AI v podnikání #129

Společnosti se potýkají s řízením obrovského množství obsahu publikovaného online, od příspěvků na sociálních médiích…

2 days ago

Analýza sentimentu s AI. Jak pomáhá řídit změny v podnikání? | AI v podnikání #128

V éře digitální transformace mají společnosti přístup k bezprecedentnímu množství dat o svých zákaznících –…

2 days ago

Nejlepší nástroje pro přepisování pomocí AI. Jak převést dlouhé nahrávky na stručné shrnutí? | AI v podnikání #127

Věděli jste, že můžete získat podstatu několika hodinového záznamu ze schůzky nebo rozhovoru s klientem…

2 days ago

Generování videa pomocí AI. Nové obzory ve výrobě video obsahu pro podniky | AI v podnikání #126

Představte si svět, kde vaše firma může vytvářet poutavá, personalizovaná videa pro jakoukoli příležitost, aniž…

2 days ago

LLMOps, neboli jak efektivně spravovat jazykové modely v organizaci | AI v podnikání #125

Aby plně využily potenciál velkých jazykových modelů (LLM), musí společnosti implementovat efektivní přístup k řízení…

2 days ago

Automatizace nebo augmentace? Dva přístupy k AI ve společnosti | AI v podnikání #124

V roce 2018 se Unilever již vydal na vědomou cestu k vyvážení automatizace a rozšiřování…

2 days ago