Categories: AI v podnikáníBlog

Detektory obsahu AI. Stojí to za to? | AI v podnikání #38

Dnes vývojáři detektorů obsahu AI představují tyto nástroje jako prostředky k ochraně autenticity. Otázkou je, zda si zaslouží důvěru a investice? V tomto článku se podíváme na to, jak detektory obsahu AI fungují, proč by mohly vymřít, jaké výzvy přinášejí a jaké etické dilemata vyvolávají.

Detektory obsahu AI

Detektory obsahu AI jsou založeny na jazykových modelech podobných těm, které se používají k generování obsahu AI. Lze je rozdělit na ty, jejichž úkolem je kontrolovat původ obrázků, textů a hudby generovaných s podporou umělé inteligence. Každý typ “detektoru AI” funguje mírně odlišně, ale žádný z nich nemůže s absolutní jistotou rozlišit mezi obsahem vytvořeným člověkem a obsahem generovaným AI.

Detektory obrázků generovaných AI hrají stále důležitější roli kvůli moci médií generovat falešné zprávy. Analyzují anomálie, charakteristické styly a vzory a hledají stopy, které zanechávají modely jako DALL-E.

Mezi prominentními detektory používanými k identifikaci obrázků je nástroj “AI or Not” od Optic, který využívá databáze obrázků generovaných Midjourney, DALL-E a Stable Diffusion. I když jsou výsledky nejisté, je to krok k vývoji přesnějších identifikačních metod v budoucnu.

Zdroj: AI or Not (https://www.aiornot.com/)

Za fungováním detektorů AI, které rozpoznávají texty generované AI, stojí pokročilé algoritmy, které analyzují strukturu a výběr slov textu a poté rozpoznávají specifické vzory AI. Využívají:

  • klasifikátory – algoritmus, který klasifikuje text a kontroluje styl, tón a gramatiku. Například popis produktu, který by mohl vyhovovat jakémukoli produktu svého typu, může být klasifikován jako výtvor AI,
  • embeddingy (embeddingy) – numerické reprezentace slov umožňují strojům porozumět kontextu jejich použití. Díky nim program “chápe”, že text s monotónním výběrem slov může být dílem AI,
  • perplexita – což je míra nepředvídatelnosti textu. Texty psané lidmi mají tendenci mít vyšší perplexitu, i když texty, které jsou inherentně jednoduché, utilitární v typické formě, nebo psané cizinci, mohou být mylně klasifikovány jako generované AI,
  • rozmanitost (burstiness) – tento faktor popisuje variabilitu v délce a struktuře vět. Lidé mají tendenci psát rozmanitější texty než umělá inteligence.

Výše uvedené prvky společně využívají detektory obsahu AI k posouzení, zda se jedná o text vytvořený člověkem nebo strojem.

Proč používat detektory obsahu AI?

Detektory obsahu AI fungují v různých oblastech – od vzdělávání po marketing a nábor. Zde jsou hlavní důvody, proč je mít jako nástroj k hodnocení, ale ne jako definitivní důkaz, zda byl obsah generován:

  • Identifikace AI-modifikovaných fotografií zobrazujících známé osoby – k detekci, zda fotografie zobrazuje skutečnou situaci,
  • Prevence dezinformací – V kontextu boje proti dezinformacím efektivní detektory obsahu AI pomáhají moderátorům sociálních médií detekovat šíření falešných informací k identifikaci a odstranění opakujícího se obsahu generovaného boty,
  • Omezení publikace textů s nízkou hodnotou – Detektory obsahu AI mohou pomoci vydavatelům odmítnout texty obsahující obecné informace generované ChatGPT, Bing nebo Bard po zadání jednoduchého dotazu.

Je však dobré si pamatovat, že původ textu není základem pro snížení hodnocení webu Google. Blog Google Search Center uvádí, že je klíčové, aby Google “odměňoval kvalitní obsah bez ohledu na to, jak byl vytvořen […]. Automatizace se již dlouho používá k generování užitečného obsahu, jako jsou sportovní výsledky, předpovědi počasí a přepisy. AI může otevřít nové úrovně vyjadřování a kreativity a být klíčovým nástrojem k podpoře vytváření skvělého webového obsahu.”

Nespolehlivost detektorů obsahu AI. Realita nebo mýtus?

I když jsou detektory obsahu AI všudypřítomné, jejich účinnost může být otázná. Hlavní problémy jsou:

  • nízká účinnost při detekci obsahu AI,
  • problémy s falešnými pozitivy, stejně jako
  • obtíže při přizpůsobování detektorů rychle se diverzifikujícím a zlepšujícím novým modelům AI.

Testy provedené OpenAI ukázaly, že jejich klasifikátor rozpoznal text generovaný GPT pouze 26% času. Zajímavým příkladem nespolehlivosti generátorů může být experiment provedený TechCrunch, který ukázal, že nástroj GPTZero správně identifikoval pět z sedmi textů generovaných AI. Zatímco klasifikátor OpenAI identifikoval pouze jeden.

Zdroj: GPTZero (https://gptzero.me/)

Kromě toho existuje riziko obdržení falešného pozitivního výsledku, tedy identifikace textu napsaného člověkem jako generovaného AI. Například začátek druhé kapitoly Don Quijota od Miguela de Cervantese byl detektorem OpenAI označen jako nejpravděpodobněji napsaný umělou inteligencí.

Zatímco chyby v analýze historických literárních textů mohou být považovány za zábavnou kuriozitu, situace se stává složitější, když chceme detektory používat jako nástroje pro hodnocení textů. Ústava USA byla ZeroGPT označena jako 92,15% napsaná umělou inteligencí. A podle studie publikované výzkumníky na Stanfordově univerzitě bylo 61% esejí TOEFL napsaných studenty, jejichž mateřským jazykem není angličtina, klasifikováno jako generované AI. Bohužel neexistují žádná data o tom, jak vysoké je procento textů mylně klasifikovaných jako pozitivní v jiných jazycích.

Dalším problémem je změna klasifikace při následných bězích detektoru. To je způsobeno tím, že se často stává, že detektor jako ZeroGPT nebo Scribbr mění klasifikaci fragmentů textu, které jednou označí jako generované AI a jindy jako napsané člověkem.

Zdroj: Scribbr (https://www.scribbr.com/ai-detector/)

Detektory obrázků a videí AI se primárně používají k identifikaci deepfake a jiného obsahu generovaného AI, který může být použit k šíření dezinformací.

Současné detekční nástroje jako Deepware, Illuminarty a FakeCatcher neposkytují testovací výsledky o své spolehlivosti. V právním kontextu detekce vizuálního materiálu generovaného AI existují iniciativy na přidání vodoznaků k obrázkům AI. To je však velmi nespolehlivý způsob – můžete si snadno stáhnout obrázek bez vodoznaku. Midjourney přistupuje k vodoznakování jinak, ponechává na uživatelích, zda chtějí obrázek tímto způsobem označit.

Vyhýbání se detekci AI. Je to možné a jak?

Podnikatelé by si měli být vědomi, že detektory obsahu AI nejsou náhradou za lidské hodnocení kvality a nejsou vždy spolehlivé. Jejich praktické údržbové problémy mohou představovat značné obtíže, stejně jako snaha vyhnout se tomu, aby byl váš obsah klasifikován jako generovaný AI. Zvláště když je AI jednoduše nástrojem v rukou profesionála – tedy to není “obsah generovaný AI”, ale spíše “obsah, který byl vytvořen ve spolupráci s AI.”

Je relativně jednoduché přidat někoho do generovaných materiálů, takže způsob, jakým jsou vytvářeny, je opravdu obtížné detekovat. Pokud osoba, která používá generativní AI, ví, jaký efekt dosáhnout, může jednoduše ručně upravit výsledky.

Základní otázka spočívá v důvodu, proč se chceme vyhnout detekci, pokud byl obsah generován AI.

  • Pokud se jedná o etickou otázku a týká se například autorství publikovaného vědeckého výzkumu – je třeba se spolehnout na profesní etiku vědce a odpovědné používání nástrojů založených na AI.
  • Pokud zaměstnavatel chce, aby zaměstnanci přestali používat AI – zůstává smluvní dohoda o používání generativní umělé inteligence.

Také to vyvolává otázku, zda chceme podporovat odpovědné používání AI prostřednictvím zákazů a odpůrců (ZeroGPT a GPTZero!), nebo prostřednictvím ocenění transparentnosti, budování důvěry a poctivého používání pokročilých technologií.

Zdroj: ZeroGPT (https://www.zerogpt.com/)

Shrnutí

Odpověď na otázku, zda stojí za to používat detektory obsahu AI, je daleko od jasné. Detektory obsahu AI jsou stále ve vývoji a jejich budoucnost je obtížné předpovědět. Jedna věc je jistá – budou se vyvíjet spolu s vývojem technologie AI. Pokroky v AI, včetně rostoucí schopnosti jazykových modelů napodobovat styl psaní člověka, znamenají, že detekce obsahu AI by se mohla stát ještě složitější. Pro podniky je to signál sledovat tyto vývoje a nespoléhat se pouze na nástroje, ale na jejich hodnocení obsahu a jeho vhodnosti pro účel, pro který byl vytvořen. A používat rychle se vyvíjející umělou inteligenci rozumně.

Pokud se vám náš obsah líbí, připojte se k naší komunitě pracovních včel na Facebooku, Twitteru, LinkedInu, Instagramu, YouTube, Pinterestu, TikToku.

Robert Whitney

Odborník na JavaScript a lektor, který školí IT oddělení. Jeho hlavním cílem je zvýšit produktivitu týmu tím, že učí ostatní, jak efektivně spolupracovat při programování.

View all posts →

Robert Whitney

Odborník na JavaScript a lektor, který školí IT oddělení. Jeho hlavním cílem je zvýšit produktivitu týmu tím, že učí ostatní, jak efektivně spolupracovat při programování.

Share
Published by
Robert Whitney

Recent Posts

Role AI v moderaci obsahu | AI v podnikání #129

Společnosti se potýkají s řízením obrovského množství obsahu publikovaného online, od příspěvků na sociálních médiích…

2 days ago

Analýza sentimentu s AI. Jak pomáhá řídit změny v podnikání? | AI v podnikání #128

V éře digitální transformace mají společnosti přístup k bezprecedentnímu množství dat o svých zákaznících –…

2 days ago

Nejlepší nástroje pro přepisování pomocí AI. Jak převést dlouhé nahrávky na stručné shrnutí? | AI v podnikání #127

Věděli jste, že můžete získat podstatu několika hodinového záznamu ze schůzky nebo rozhovoru s klientem…

2 days ago

Generování videa pomocí AI. Nové obzory ve výrobě video obsahu pro podniky | AI v podnikání #126

Představte si svět, kde vaše firma může vytvářet poutavá, personalizovaná videa pro jakoukoli příležitost, aniž…

2 days ago

LLMOps, neboli jak efektivně spravovat jazykové modely v organizaci | AI v podnikání #125

Aby plně využily potenciál velkých jazykových modelů (LLM), musí společnosti implementovat efektivní přístup k řízení…

2 days ago

Automatizace nebo augmentace? Dva přístupy k AI ve společnosti | AI v podnikání #124

V roce 2018 se Unilever již vydal na vědomou cestu k vyvážení automatizace a rozšiřování…

2 days ago