Dnes vývojáři detektorů obsahu AI představují tyto nástroje jako prostředky k ochraně autenticity. Otázkou je, zda si zaslouží důvěru a investice? V tomto článku se podíváme na to, jak detektory obsahu AI fungují, proč by mohly vymřít, jaké výzvy přinášejí a jaké etické dilemata vyvolávají.
Detektory obsahu AI jsou založeny na jazykových modelech podobných těm, které se používají k generování obsahu AI. Lze je rozdělit na ty, jejichž úkolem je kontrolovat původ obrázků, textů a hudby generovaných s podporou umělé inteligence. Každý typ “detektoru AI” funguje mírně odlišně, ale žádný z nich nemůže s absolutní jistotou rozlišit mezi obsahem vytvořeným člověkem a obsahem generovaným AI.
Detektory obrázků generovaných AI hrají stále důležitější roli kvůli moci médií generovat falešné zprávy. Analyzují anomálie, charakteristické styly a vzory a hledají stopy, které zanechávají modely jako DALL-E.
Mezi prominentními detektory používanými k identifikaci obrázků je nástroj “AI or Not” od Optic, který využívá databáze obrázků generovaných Midjourney, DALL-E a Stable Diffusion. I když jsou výsledky nejisté, je to krok k vývoji přesnějších identifikačních metod v budoucnu.
Zdroj: AI or Not (https://www.aiornot.com/)
Za fungováním detektorů AI, které rozpoznávají texty generované AI, stojí pokročilé algoritmy, které analyzují strukturu a výběr slov textu a poté rozpoznávají specifické vzory AI. Využívají:
Výše uvedené prvky společně využívají detektory obsahu AI k posouzení, zda se jedná o text vytvořený člověkem nebo strojem.
Detektory obsahu AI fungují v různých oblastech – od vzdělávání po marketing a nábor. Zde jsou hlavní důvody, proč je mít jako nástroj k hodnocení, ale ne jako definitivní důkaz, zda byl obsah generován:
Je však dobré si pamatovat, že původ textu není základem pro snížení hodnocení webu Google. Blog Google Search Center uvádí, že je klíčové, aby Google “odměňoval kvalitní obsah bez ohledu na to, jak byl vytvořen […]. Automatizace se již dlouho používá k generování užitečného obsahu, jako jsou sportovní výsledky, předpovědi počasí a přepisy. AI může otevřít nové úrovně vyjadřování a kreativity a být klíčovým nástrojem k podpoře vytváření skvělého webového obsahu.”
I když jsou detektory obsahu AI všudypřítomné, jejich účinnost může být otázná. Hlavní problémy jsou:
Testy provedené OpenAI ukázaly, že jejich klasifikátor rozpoznal text generovaný GPT pouze 26% času. Zajímavým příkladem nespolehlivosti generátorů může být experiment provedený TechCrunch, který ukázal, že nástroj GPTZero správně identifikoval pět z sedmi textů generovaných AI. Zatímco klasifikátor OpenAI identifikoval pouze jeden.
Zdroj: GPTZero (https://gptzero.me/)
Kromě toho existuje riziko obdržení falešného pozitivního výsledku, tedy identifikace textu napsaného člověkem jako generovaného AI. Například začátek druhé kapitoly Don Quijota od Miguela de Cervantese byl detektorem OpenAI označen jako nejpravděpodobněji napsaný umělou inteligencí.
Zatímco chyby v analýze historických literárních textů mohou být považovány za zábavnou kuriozitu, situace se stává složitější, když chceme detektory používat jako nástroje pro hodnocení textů. Ústava USA byla ZeroGPT označena jako 92,15% napsaná umělou inteligencí. A podle studie publikované výzkumníky na Stanfordově univerzitě bylo 61% esejí TOEFL napsaných studenty, jejichž mateřským jazykem není angličtina, klasifikováno jako generované AI. Bohužel neexistují žádná data o tom, jak vysoké je procento textů mylně klasifikovaných jako pozitivní v jiných jazycích.
Dalším problémem je změna klasifikace při následných bězích detektoru. To je způsobeno tím, že se často stává, že detektor jako ZeroGPT nebo Scribbr mění klasifikaci fragmentů textu, které jednou označí jako generované AI a jindy jako napsané člověkem.
Zdroj: Scribbr (https://www.scribbr.com/ai-detector/)
Detektory obrázků a videí AI se primárně používají k identifikaci deepfake a jiného obsahu generovaného AI, který může být použit k šíření dezinformací.
Současné detekční nástroje jako Deepware, Illuminarty a FakeCatcher neposkytují testovací výsledky o své spolehlivosti. V právním kontextu detekce vizuálního materiálu generovaného AI existují iniciativy na přidání vodoznaků k obrázkům AI. To je však velmi nespolehlivý způsob – můžete si snadno stáhnout obrázek bez vodoznaku. Midjourney přistupuje k vodoznakování jinak, ponechává na uživatelích, zda chtějí obrázek tímto způsobem označit.
Podnikatelé by si měli být vědomi, že detektory obsahu AI nejsou náhradou za lidské hodnocení kvality a nejsou vždy spolehlivé. Jejich praktické údržbové problémy mohou představovat značné obtíže, stejně jako snaha vyhnout se tomu, aby byl váš obsah klasifikován jako generovaný AI. Zvláště když je AI jednoduše nástrojem v rukou profesionála – tedy to není “obsah generovaný AI”, ale spíše “obsah, který byl vytvořen ve spolupráci s AI.”
Je relativně jednoduché přidat někoho do generovaných materiálů, takže způsob, jakým jsou vytvářeny, je opravdu obtížné detekovat. Pokud osoba, která používá generativní AI, ví, jaký efekt dosáhnout, může jednoduše ručně upravit výsledky.
Základní otázka spočívá v důvodu, proč se chceme vyhnout detekci, pokud byl obsah generován AI.
Také to vyvolává otázku, zda chceme podporovat odpovědné používání AI prostřednictvím zákazů a odpůrců (ZeroGPT a GPTZero!), nebo prostřednictvím ocenění transparentnosti, budování důvěry a poctivého používání pokročilých technologií.
Zdroj: ZeroGPT (https://www.zerogpt.com/)
Odpověď na otázku, zda stojí za to používat detektory obsahu AI, je daleko od jasné. Detektory obsahu AI jsou stále ve vývoji a jejich budoucnost je obtížné předpovědět. Jedna věc je jistá – budou se vyvíjet spolu s vývojem technologie AI. Pokroky v AI, včetně rostoucí schopnosti jazykových modelů napodobovat styl psaní člověka, znamenají, že detekce obsahu AI by se mohla stát ještě složitější. Pro podniky je to signál sledovat tyto vývoje a nespoléhat se pouze na nástroje, ale na jejich hodnocení obsahu a jeho vhodnosti pro účel, pro který byl vytvořen. A používat rychle se vyvíjející umělou inteligenci rozumně.
Pokud se vám náš obsah líbí, připojte se k naší komunitě pracovních včel na Facebooku, Twitteru, LinkedInu, Instagramu, YouTube, Pinterestu, TikToku.
Odborník na JavaScript a lektor, který školí IT oddělení. Jeho hlavním cílem je zvýšit produktivitu týmu tím, že učí ostatní, jak efektivně spolupracovat při programování.
Společnosti se potýkají s řízením obrovského množství obsahu publikovaného online, od příspěvků na sociálních médiích…
V éře digitální transformace mají společnosti přístup k bezprecedentnímu množství dat o svých zákaznících –…
Věděli jste, že můžete získat podstatu několika hodinového záznamu ze schůzky nebo rozhovoru s klientem…
Představte si svět, kde vaše firma může vytvářet poutavá, personalizovaná videa pro jakoukoli příležitost, aniž…
Aby plně využily potenciál velkých jazykových modelů (LLM), musí společnosti implementovat efektivní přístup k řízení…
V roce 2018 se Unilever již vydal na vědomou cestu k vyvážení automatizace a rozšiřování…