Umělá inteligence může odborným nakladatelstvím pomoci. Musíme ale tlačit na její otevřenost a kvalitu

V zájmu vědecké komunity i veřejnosti je, aby velké jazykové modely jako GPT fungovaly transparentně a spolehlivě. V odborném publikování pak mohou ušetřit mnoho rutinní práce – a přinést renesanci vědecké komunikace.

Na letošní konferenci Asociace evropských univerzitních nakladatelů (AEUP) konané v estonských městech Tallin a Tartu se hodně mluvilo o důsledcích vzestupu umělé inteligence na vydávání odborných knih a časopisů. Důvod je zřejmý: popularita služby ChatGPT a její konkurence jako Bard či Claude.

Současné pokročilé jazykové modely se dokázaly celkem dobře naučit syntaxi a sémantiku lidského jazyka. Konverzace s nimi často působí jako rozhovor se skutečným člověkem a jejich výstupy jsou mnohdy k nerozeznání od textů psaných lidmi.

Pro svět publikování a vědy i pro jejich průnik to má vážné důsledky. Chceme přece vědět, jestli vědeckou publikaci vydanou renomovaným odborným nakladatelstvím napsal člověk, nebo robot. Na druhou stranu s umělou inteligencí běžně pracujeme už teď a nebojíme se toho – využívají ji nástroje na automatické opravy textu, kontrolu pravopisu či automatický překlad. V redakcích se běžně používá software usnadňující různé fáze redakčního procesu, tvorbu anotací nebo rejstříků. Někde se pouštějí ještě dál a nechávají umělou inteligenci pomáhat s posudky na odborné články.

Všechno výše uvedené dlouho dělali lidé, a pokroky v rozvoji AI proto zcela pochopitelně vzbuzují obavy, že mnoho z nich ztratí práci. Je to velmi pravděpodobné: podle jedné studie umělá inteligence do roku 2030 celosvětově nahradí 15 procent zaměstnanců a zaměstnankyň, tedy až 400 milionů lidí.

Tyto lidi o práci nicméně nepřipraví samotná umělá inteligence, ale spíše jiní lidé, kteří se ji naučí dobře využívat. AI totiž nepracuje sama, i když to tak na první pohled vypadá. Pouze reaguje na napsané zadání, takzvaný prompt. Čím lepší prompt, tím lepší výsledek. A abyste dokázali dobře promptovat (ano, čeština už toto slovo používá), neobejdete se bez hlubokých znalostí oblasti, v níž se pohybujete.

Velmi dobře to ukazuje spisovatel Stephen Marche, který se pomocí umělé inteligence pokusil napsat detektivní novelu: „Vím, jak má vypadat dobrý text. Vím, koho by měla Sudowrite (použitý AI nástroj, pozn. red.) napodobovat, a dokážu vysvětlit proč. Vím, jak má vypadat vybroušená věta a odstavec dovedený k dokonalosti. Literární tvorbě nestačí rozumět méně, musíte ji naopak rozumět lépe.“

Můžeme si tedy dovolit předpokládat, že kdyby měla AI psát odborné články, stále by to od lidí vyžadovalo velmi dobrou znalost konkrétní problematiky a navíc velmi dobré prompty.

Není však pochyb o tom, že jde o zcela zásadní proměnu celého prostředí. Jak na jarní konferenci AEUP uvedl přední odborník na otevřenou vědu a vizionář Pierre Mounier, prožíváme největší revoluci v odvětví od Gutenbergova vynálezu knihtisku.

Roboti útočí. Cíl: odborné publikování

Účastníci a účastnice zmíněné konference nevěnovali příliš pozornosti obavám, že přijdou o práci. Trápily je spíše jiné věci: budoucnost autorství a copyrightu nebo problém nadbytku textů nepřinášejících nic nového a s tím související potenciální kolaps systému recenzních posudků. Ten je ostatně v krizi už teď.

AI nicméně pracovní trh promění – a to i v oblasti odborného publikování. Sarah Moorhouse, redaktorka SAGE Publishing, ve svém článku pro The Bookseller zmiňuje roli odborných asistentů, kteří se často podílejí na odborných publikacích svých školitelů: „Když výzkumníci spolupracují s asistenty, dochází ke vzájemné produktivní výměně myšlenek mezi odborníky na různých úrovních univerzitní hierarchie. Jestliže jim ale první verzi článku vytvoří ChatGPT, akademický ekosystém, jehož je publikovaný článek jen nepatrnou součástí, se tím v mnohém ochudí.“

Dalším a možná ještě palčivějším problémem je hodnocení vědeckých publikací, tedy peer-review. O pozornost recenzentů soupeří obrovské množství rukopisů, což vydání článků výrazně zpomaluje. Recenzenti tuto práci navíc většinou dělají bezúplatně. Nelze se divit, že při zvážení všech ostatních povinností akademických pracovníků jejich motivace psát recenze klesá. Už dlouho se mluví o tom, že je takový systém neudržitelný, ačkoli se počty článků zatím neustále zvyšují.

Na vině není jen nastavení systému podle hesla „publish or perish“, ale částečně také automatizace. Je možné, že až čtvrtina rukopisů zaslaných v některých oborech k recenznímu řízení je dílem takzvaných paper mills, tedy společností, které za úplatu produkují plagiáty či zcela smyšlené rukopisy. Ty teď dostaly k ruce nástroje, které takový „vědecký“ článek vygenerují za pár sekund. „Vzhledem k tomu, jak lehkovážně ChatGPT přistupuje k faktům, celý peer-review systém se může brzy ocitnout na velmi tenkém ledě,“ předpovídá Sarah Moorhouse.

Kromě kolapsu systému peer-review představuje tato situace ještě další problém: „Jak budou vědci moci vycházet z dříve publikovaných výsledků, pokud bude celý systém akademického publikování kontaminován tisíci věrohodně působících, ale falešných článků? Jak můžeme trénovat potenciálně užitečné AI výzkumné asistenty, aby čerpali nové poznatky z vědeckých prací, když budou do velké míry nesmyslné?“ ptá se Tim Vines z odborného webu The Scholarly Kitchen.

Dále tu máme zmíněný problém s autorstvím a citacemi. Z čeho se vlastně umělá inteligence učí? Kdo je autorem textu, který napsala AI? Jak citovat použité zdroje?

„Je to také otázka plagiátorství. ChatGPT neuvádí, z čeho čerpá, když reaguje na vaše prompty. Používá věty někoho jiného? Parafrázuje něčí myšlenky? Tohle všechno musíme mít na paměti,“ upozorňuje šéfredaktor technologického webu Gizmodo David Ewalt.

A navíc: AI je natrénovaná na existujících textech, z nichž mnohé jsou plné nejen zavádějících a nepravdivých informací, ale také předsudků a nenávisti. Existují sice omezení, která umělé inteligenci brání produkovat nenávistné texty, ale není nijak těžké je obejít.

Stávající systém odborného publikování závisí mimo jiné na důvěře a osobní integritě. Jenže velké jazykové modely není technicky možné naprogramovat tak, aby psaly pravdu. Pracují tak, aby byli čtenáři s jejich výsledky spokojení, což je něco zcela jiného a přímo to odporuje akademickým zásadám. Namísto pronikavých a zásadních vědeckých poznatků budeme možná brzy čelit nekonečnému množství zcela banálních článků beze stopy invence či kreativity. Když si nedáme pozor, můžeme se snadno ocitnout ve světě „s tolika falešnými texty a obrazy, že už nikdo nedokáže rozlišit, co je vlastně pravda“.

Esejista Nassim Nicholas Taleb ve svém bonmotu nabízí poněkud zjednodušený pohled na AI jako na „stroj papouškující klišé“ a v komentářích se nevyhnul rozhořčené kritice uživatelů ChatGPT. Faktem ale je, že přijít s něčím novým, co „tady ještě nebylo“, je teď těžké už i pro lidi samotné.

Opačný pohled na perspektivy umělé inteligence nabízí článek britského spisovatele Stephena Marcheho The Future of Writing Is a Lot Like Hip-Hop.

Umělá inteligence může přinést únik z šablonovitosti právě tím, že funguje otevřeně derivativně. Není to nic jiného. DJ Kool Herc, první hiphopový DJ, si 11. srpna 1973 přinesl v Bronxu na sestřinu párty u příležitosti zahájení semestru dva gramofony a mikrofon, jaké vídával na diskotékách v centru města. Na nich pak izoloval a následně opakoval funkové beaty a v jistém smyslu provedl vrcholně derivativní věc: v podstatě jen opakoval dobrý motiv z úspěšné nahrávky pořád dokola. Zároveň ale udělal i něco vrcholně originálního: vymyslel break. Hip-hop se tím rozrostl o zcela nový žánr, nový styl, nový přístup k životu. Trvalo asi dvacet let, než lidé uznali, že hip-hop je umění, ale když k tomu došlo, ukázalo se, že jde o nejvýznamnější umění své doby. Kultura často funguje neintuitivně. Umělá inteligence může být lanem, které nás vytáhne z propasti neustálého opakování již řečeného.

Marcheho text hezky ukazuje, že AI skutečně může nabídnout i nové příležitosti. Hodně už bylo řečeno například o tom, že je nutné změnit současný systém hodnocení vědy, který nutí vědce publikovat stále nové a nové texty. Možná je právě rozmach AI, která to možná brzy dokáže mnohem lépe (a zcela určitě rychleji) než oni, impulsem k reálné změně. A to není všechno.

Cesta z pasti

Je snadné vysypat z rukávu výhody, které nám umělá inteligence může přinést, nebo dokonce už přináší, především z hlediska efektivity a produktivity práce. Editorům a literárním agentům pomáhá rychleji zpracovat přijaté náměty. Rozvíjejí se možnosti digitálních osobních asistentů. Slibná budoucnost čeká analýzu dat: „Nakladatelé mohou využít umělou inteligenci k analýze údajů o čtenářích a rozpoznávání trendů, což jim pomůže lépe rozhodovat o tom, jaké knihy vydávat, jak je uvádět na trh a jak je nacenit,“ říká Red Hilton z Belmont City Press.

Přímo před očima se zlepšují nástroje automatického překladu. Sarah Elaine Eaton z Committee on Publication Ethics zaujala na konferenci AEUP účastníky svým odhadem, že už brzy bude možné, aby každý mluvil svojí řečí a ostatní ho poslouchali ve svých preferovaných jazycích. Funkční automatické simultánní tlumočení máme na dosah a brzy si budete také moci vybrat z desítek různých jazykových verzí každé odborné publikace.

Budoucnost možná nakonec nespočívá v několika málo všeobecných velkých jazykových modelech, o kterých se dnes nejvíc mluví, ale spíše v menších a specializovaných řešeních. Je pravděpodobné, že vzniknou odborné jazykové modely trénované na ověřených (a otevřených!) datech, jejichž výstupy budou důvěryhodnější. Společnost Clarivate, provozovatel citační databáze Web of Science, nedávno oznámila spolupráci s týmem AI21 Labs. Jejich cílem je integrovat velké jazykové modely do svých nástrojů a nabídnout tak odborníkům intuitivní vyhledávání a rešerše pomocí konverzační AI speciálně navržené tak, aby „pomáhala výzkumníkům i studentům dosáhnout úspěchu a zároveň zůstala v souladu se základními vědeckými zásadami a hodnotami.“

Aby nám mohla umělá inteligence dobře sloužit, je především nutné nastavit jejímu použití správná pravidla. A to nebude jednoduché. Například Itálie nejprve ChatGPT zcela zakázala, ale brzy se ukázalo, že to nebude ta správná cesta. To stejné platí i v případě používání AI na školách a univerzitách. Žádná všeobecně platná pravidla použití zatím neexistují, ale na některých principech se shodují téměř všichni. Především, že nelze uvádět AI jako spoluautora (takové publikace nepřijímají mimo jiné v Cambridge University Press či Springer Nature). Můžete ji však využít pro první draft textu, který potom dále rozpracujete, a hlavně za něj převezmete autorskou odpovědnost.

Stejně tak je nezbytné, aby vývojáři nesli zodpovědnost za své produkty. „Poskytovatelé generativní umělé inteligence musí na vyžádání předložit detailní seznam knih a článků, které použili při tréninku své AI, stejně jako informace o tom, z jakých zdrojů je získali. Nebudeme-li trvat na potřebné transparentnosti, naše práva zůstanou jen na papíře a jediný užitek z toho všeho budou mít velké technologické společnosti, na úkor kulturní rozmanitosti a společnosti jako takové,“ varuje Ricardo Levi, prezident Evropské federace vydavatelů.

Zdá se, že jeho volání bylo vyslyšeno. Evropský parlament v polovině června 2023 schválil návrh dokumentu označovaného jako AI Act, který se může stát vůbec první zákonnou normou regulující umělou inteligenci ve všech jejích podobách. Uvádí, že poskytovatelé generativní AI povinně „zdokumentují a zveřejní dostatečně podrobný přehled použitých tréninkových dat chráněných podle autorského práva“. Než z návrhu vznikne skutečný legislativní dokument, musí se vyjednat podpora v jednotlivých členských zemích, a jeho podoba se tedy pravděpodobně bude ještě proměňovat. Rychlost schválení prvního návrhu však ukazuje odhodlání EU se k otázce AI nějak postavit.

Aktivity Evropského parlamentu potvrzují, že při snaze regulovat AI převažují tendence k co největší otevřenosti. Po té my univerzitní nakladatelé voláme už dlouho, protože je nám jasné, že závislost vědecké komunikace na několika málo obřích komerčních nakladatelstvích neprospívá nikomu. Pokud se tedy podaří dosáhnout toho, že bude umělá inteligence od začátku trénování z principu otevřená, a pokud zabráníme vzniku oligopolního systému, v němž proudí veřejné peníze směrem k nepočetné skupině soukromých firem, budeme šťastní. Principy otevřené vědy nám navíc pomohou také v boji proti falešným vědeckým výstupům.

Naznačila jsem, že by nástup AI mohl být poslední kapkou, která vědeckou komunitu konečně přinutí přenastavit systém hodnocení vědy. K tomu už vyzývají mnohé instituce, mimo jiné například Evropská asociace univerzit. Počítače totiž na rozdíl od lidí není škoda pro činnosti, které se pořád opakují. Když tedy někteří akademikové dokola publikují stále tytéž myšlenky v nových a nových článcích a konferenčních sbornících, kdo je předčí? Správně, počítač.

Přišel tedy čas zvážit, k jaké vědě chceme směřovat. Co vlastně chceme hodnotit a učit. „Opravdu podporujeme ve výuce kreativitu, nové myšlenky a originální nápady? Učíme respektu k hodnotám? A co přesně hodnotíme? Neoceňujeme jen schopnost napsat text, pro jehož tvorbu by se dal snadno využít stroj?“ ptá se v rozhovoru pro magazín Universitas Thomas Jørgensen z Evropské univerzitní asociace.

Jørgensen pokračuje: „Pokud počítač či umělá inteligence dokážou poskládat správné informace tak, abychom získali nové poznatky, pak stojíme před těžkou otázkou: Co je vlastně na výzkumném procesu výlučně lidského?“ To je opravdu těžká otázka, ale možná, že není zase tak důležitá. Kdyby dokázala AI napsat objevný článek vycházející z ověřených faktů, který by byl v souladu s principy vědeckého poznání, vadilo by, že je autorem právě AI? Možná ani tak nejde o to, kdo je autorem, ale zda je publikace pro vědeckou komunitu a společnost jako takovou přínosná.

Klíčem jsme my

Na tyto a podobné velmi složité otázky dokáže nejlépe reagovat samotné vědecké společenství se svými standardy. „Klíčem je komunita,“ opakuje již zmiňovaný Pierre Mounier, a to nejen tehdy, když mluví o situaci kolem AI. Jeho slova potvrzují mnozí, citujme například Jessicu Miles z webu The Scholarly Kitchen: „Především nesmíme ztratit důvěru. V centru všeho dění musí být lidé a naším cílem musí být rozvoj výzkumu, odstraňování předsudků a boj proti podvodníkům. Musíme zaručit kvalitu a integritu.“

Lidé, vztahy, komunikace, to jsou předpoklady budoucího úspěchu: „Vztahové dovednosti a schopnost vést konstruktivní dialog budou pravděpodobně pro budoucnost lidstva mnohem důležitější než mnohé z dovedností, jimž se dnes studenti učí a které budou brzy automatizované,“ přidává se Jeremy Weissman, odborník na etické, právní a společenské důsledky nástupu nových technologií.

Pro nás univerzitní nakladatele je to jasné. Právě naše komunita – naši autoři, redaktoři, spolupracovníci a čtenáři – dává naší existenci smysl. Víme, kdo napsal knihy, které vydáváme. S autory, recenzenty, korektory, sazeči i tiskaři se osobně známe a dokážeme se za ně postavit. Nejsou to roboti.

Závěrem si dovolím malou, ale související odbočku: v květnu 2023 vydala Rada Evropské unie Závěry o vysoce kvalitní, transparentní, otevřené, důvěryhodné a spravedlivé akademické publikační činnosti vyzývající mimo jiné k zajištění otevřeného přístupu k publikacím, které prezentují výsledky výzkumu financovaného z veřejných rozpočtů. Dokument zdůrazňuje význam neziskových modelů vědeckého publikování s otevřeným přístupem, které nevybírají poplatky od autorů ani čtenářů, a vyzývá k podpoře rozvoje takových modelů publikování pod vedením veřejných výzkumných organizací. Tedy univerzitních nakladatelství.

Jak to souvisí s umělou inteligencí? Po dlouhém období komercionalizace vědecké komunikace si lidé začínají silněji uvědomovat, že několik soukromých společností má neúměrný vliv v oblasti vědy, jejího hodnocení a šíření. Je to situace, která je výhodná pro největší hráče, ale nikoli pro společnost jako celek. Proto Evropská unie vyzývá k podpoře nekomerčních odborných nakladatelství, která dokážou zajistit požadovanou pestrost, vydávají publikace v mnoha různých jazycích, nestavějí si kolem sebe žádné nepřekonatelné finanční bariéry a vůbec je pro vědeckou komunitu radost s nimi spolupracovat.

Komunita a kvalitní spolupráce je to, díky čemu máme šanci nenechat se umělou inteligencí převálcovat. Univerzitní nakladatelství přirozenými centry akademických komunit, na nichž teď bude záležet víc než kdy dřív.

Tradiční výhodou univerzitních nakladatelství je, že naslouchají svým autorům a čtenářům a snaží se jim operativně poskytovat právě ty služby, které jsou zrovna potřeba. Přesně jak to všem nakladatelům radí zkušená nakladatelka a literární agentka Mary Kole: „Nenechte se pohltit odporem vůči našim případným robotickým vládcům a raději se učte, jak s nimi pracovat, tvořit a celkově vycházet. Oni se neustále učí – a spisovatelé i nakladatelé by měli také.“