Jak počítačová myš zatřásla s akademií. Historie a budoucnost plagiátorství

Nové technologie usnadňující akademické podvody přicházejí ve stále prudším tempu. Inteligentní generátory textu mohou vynutit úpravy etických kodexů ještě rychleji, než se to povedlo funkci cut and paste nebo internetovým vyhledávačům. 

Přehrajte si víc článků v našem podcastu v iOSu, Androidu, Spotify a dalších.

Termín „plagiátorství“ je s námi skoro dva tisíce let. Když římský básník Marcus Valerius Martialis na sklonku prvního století našeho letopočtu zjistil, že jeho epigramy recituje a vydává za své vlastní muž jménem Fidentinus (historie ho zná jen z tohoto incidentu), počastoval ho v posměšné básni výrazem plagiarus. Ten se tehdy používal pro zločince, kteří unášeli svobodné muže do otroctví.

Zatímco únos svobodných mužů do otroctví zločinem byl, kopírování veršů a dalšího intelektuálního vlastnictví ne. Římský kulturní průmysl práva autorů knih a dramat uznával, vystačil si ale s gentlemanskými dohodami. U těch v Evropě zůstalo až do začátku 18. století. Ne proto, že by byl kontinent v minulosti plný gentlemanů. Plagiátorství, zvláště písemných materiálů, jen dlouho nedávalo ekonomický smysl: jednak bylo nutné kopie opisovat jednu po druhé ručně a ani se nedostávalo masového publika. 

To se pomalu mění s nástupem knihtisku v 16. století a následným nárůstem gramotnosti, která v polovině 17. století v Anglii a Nizozemí poprvé překonává hranici 50 procent populace. Právě Anglie jako první země reguluje práva autorů a nakladatelů zákonem. Copyright Act 1710 jim zaručuje, že minimálně čtrnáct let po prvním vydání knihy nemůže stejný materiál bez jejich souhlasu vydat nikdo jiný.

Původní slova, ukradené myšlenky

Autorské zákony nemohou být příliš přísné: kdyby vedle kopírování doslovných znění děl zakazovaly i přebírání jejich myšlenek, motivů nebo žánrových postupů, kulturu by udusily. Jenže co je prospěšné pro umění, může být zhoubné pro akademickou scénu. Ta si tedy musí hranici mezi přijatelnou mírou inspirace a nežádoucím plagiátorstvím najít sama.

Jedna z prvních takových kauz se částečně odehrála na území dnešního Slovenska. V letech 1840 a 1841 publikuje duchovní Miklós János Cherrier z Nitry čtyřdílné dějiny katolické církve. Několik měsíců po vydání ho v žurnálu Athenaeum obviňuje další duchovní, Ignác Udvardy z města Veszprém ležícího v dnešním Maďarsku, že podstatné části díla převzal ze starších publikací Jacoba Ruttenstocka a Lászla Vasse, aniž by je uvedl jako zdroj. Tak rychlé odhalení nebylo náhodné: akademická obec byla ve srovnání se současností malá, suma dosaženého poznání také, plagiátorství těžko mohlo projít bez povšimnutí.

Cherrier ale zřejmě upřímně věřil, že neudělal nic špatného. V tisku se brání kombinací osobních útoků na Udvardyho a legračního dokládání vlastní morálky: čtyři díly prý sepsal tak rychle díky tomu, že pracuje až čtrnáct hodin denně. Do veřejné debaty se postupně zapojují další autoři a táhne se ještě zhruba rok. I když z ní Cherrier vyvázne bez postihu, její závěr je jednoznačný: i parafrázované zdroje je nutné citovat.

Jak dlouhé to chcete?

Z 19. století pocházejí i první zmínky o „essay mills“, tedy vyměňování vypracovaných školních úkolů mezi studenty. Eseje se točily dokola na jednotlivých fakultách, můžeme proto předpokládat, že pro učitele nebylo těžké takové podvody prokouknout, alespoň pokud nebyli líní odevzdané práce otevřít. 

Situace se změnila ve prospěch podvádějících studentů přibližně v polovině 20. století s povýšením essay mills na prosperující byznys. Tou dobou se ve Spojených státech rozmáhají společnosti, od kterých si lze koupit předpřipravenou práci i vypracování úkolu na zakázku, a to zhruba do dvou týdnů od složení zálohy. Firmy dlouho operují v právním vakuu, než nejvyšší soud státu New York staví v roce 1972 tento druh podnikání mimo zákon a další americké státy se rychle přidávají. 

Podvodný byznys to poškozuje, ale nezastavuje. Brzdí ho opět hlavně technologická omezení: kopie se stále vyráběly de facto ručně, byť už na psacích strojích.

Ctrl-cizí, ctrl-vlastní

Kombinaci klávesových zkratek ctrl+C a ctrl+V si žáčci v hodině informatiky osvojí za pár minut, cesta k nim ovšem zabrala nejbystřejším mozkům Silicon Valley víc než dekádu.

Za pohodlné kopírování a vkládání vděčíme Larrymu Teslerovi. Ten se v půlce sedmdesátých let snažil svoje šéfy v Xerox PARC přesvědčit o nesmyslnosti nového produktu firmy – počítačové myši. Tesler měl za to, že pro práci s počítačem jsou nejpraktičtější klávesy se šipkami. „Když jsme sebrali lidi z ulice, kteří nikdy neviděli počítač, pohybovat se po textu s pomocí kurzorových kláves se naučili za pár minut,“ citoval ho magazín IEEE Spectrum v jeho předloňském nekrologu. Když ti samí účastníci testování zkoušeli myš, po chvíli se prý vrátili zpátky ke klávesnici.

Tesler nakonec pochopil, že problém není v myši samotné, ale v osmi tlačítkách, kterými se ovládala. Zredukoval počet na jedno, které v textovém editoru Xerox Gypsy dokázalo skvělou věc: prvním kliknutím a podržením označit text a druhým kliknutím a podržením ho přetáhnout na jiné místo v dokumentu. Tesler dává funkci dodnes používaný název cut, copy and paste. Mezipaměť, která umožňuje kopírování obsahu mezi různými dokumenty, pojmenovává clipboard – schránka. To jsme v roce 1975.

Na kombinaci zkratek control+C a control+V si ale musíme počkat do roku 1984, kdy se objevuje v operačním systému nového osobního počítače Apple Macintosh. Na ostatní platformy se známý hmat rozšiřuje pomalu: ve Wordu pro Windows šlo těmito zkratkami kopírovat a vkládat až ve verzi 2.0 v roce 1992. Otálení mělo svůj důvod: na platformě PC byla klávesová zkratka ctrl+C vyhrazená pro ukončení aktuální úlohy. Dodnes tak ostatně funguje třeba v Terminálu Windows.

Žně

Na sklonku 80. let je tedy situace na univerzitách v bohatých zemích následující: studentů a studentek přibývá, jejich vyučující ovšem mají na kontrolu odevzdaných prací času přinejlepším pořád stejně. Počítačové učebny se plní stroji, na kterých lze během sekund okopírovat cizí materiál a během minut ho přeformulovat. 

Byznysplán založený na prodeji hotových školních prací se ukázal jako životaschopný, byť dosud narážel na výrobní limity i na to, že má-li být fyzická adresa známá klientům, bude stejně dobře známá i policejním vyšetřovatelům.

Jaká poslední přísada do rozbušky masového plagiátorství ještě schází?

Stává se jí samozřejmě internet. Ten se právě na přelomu 80. a 90. let zpřístupňuje masám: první soukromí poskytovatelé ho přivádějí do domácností, vedle starších služeb se rozbíhá uživatelsky přístupný World Wide Web a rychle se plní materiálem k okopírování. Začínají zlaté roky pro studium v případě, že jste líní psát. 

Ovšem pozor: je to past.

Co mi to jenom připomíná

Prvním nástrojem, kterým lze odhalit okopírované práce, se v půlce 90. let stávají vyhledávače schopné najít na webu vedle jednotlivých klíčových slov i celé fráze. Nebyla to bůhvíjaká zbraň. Teprve Google, spuštěný v roce 1998, se mohl pochlubit zaindexováním podstatné části webu, ovšem do školních archivů odevzdaných prací pořád neviděl. Letmá ruční kontrola dvou tří vět nemusela natrefit na ukradenou pasáž a parafráze pochopitelně zůstávaly neodhalitelné.

Ačkoliv se volání po automatizaci kontroly originality ozývalo už od 80. let, na první prakticky využitelnou službu se čekalo až do roku 2000: prvenství bere Turnitin. Ten dnes používají i české univerzity, a to vedle vlastních nástrojů jako Theses.cz nebo Odevzdej.cz.

Právě Odevzdej.cz pomohl v roce 2018 usvědčit z plagiátorství v diplomové práci českou ministryni spravedlnosti Taťánu Malou, která kvůli odhalenému provinění skončila v úřadě po pouhých třinácti dnech. V témže roce usvědčili slovenští novináři z plagiátorství v rigorózní práci předsedu Národní rady Andreje Danka, který si ale svoji funkci i přes skandál udržel. V Německu stálo plagiátorství v disertační práci vládní křeslo ministra obrany Karla-Theodora zu Guttenberga. Pozoruhodné na tom je, že se všichni tři podvodů dopustili v nultých letech, kdy už je mohlo napadnout, že je v budoucnu bude moci potopit kdokoliv, komu to bude stát za hodinu googlování.

Úplně nové problémy

Závody v technologickém zbrojení mezi akademickými podvodníky a etickými komisemi se teď dostávají do nového kola. Obě strany se učí využívat umělou inteligenci, přesněji systémy strojového učení.

Studentům a studentkám líným psát otevírají nové obzory především nástroje pro generování textu, jako je GPT. Jeho poslední verze dovede zhotovit soudržný a mnohdy i vyloženě povedený text na prakticky libovolné téma. Nemusí jít jenom o eseje, vedle dalších žánrů písemného projevu zvládá i jednodušší programování.

Systémy schopné inteligentní práce s textem a dalšími formami obsahu ale na druhou stranu také pomůžou s odhalováním plagiátů. Lze si od nich slíbit chytřejší rozpoznávání parafrází, obrázků volně překreslených z internetu či obsahu oposlouchaného z přednášek na YouTube.

Akademický svět proto čeká nová debata o tom, co vlastně je, nebo není původní výzkum a co původní výstupy. Dnes už by nás nenapadlo přemýšlet nad tím, zda je využití automatické kontroly pravopisu při psaní diplomové práce podvodem: bereme naopak za projev drzosti, když diplomant nebo diplomantka nechají v textu zjevné hrubky. 

Jak přistoupíme ke stále se zlepšujícím inteligentním nástrojům pro broušení slohu, jako je Grammarly? Pracovat se strojovým překladem v jazykových kurzech neetické jednoznačně je, ale kdybychom takovou asistenci zakázali při akademické práci plošně, nepřipravili bychom se o poznání uložené v jiných než světových jazycích? 

Není nakonec při psaní vědeckého článku přijatelné zadat napsání například úvodní, rekapitulační části stati generátoru a svoje síly věnovat analytičtějším kapitolám a závěru? 

A dohodneme se na pravidlech platných pro všechny, nebo dovolíme podobné chytré digitální asistenty například pouze lidem s různými handicapy?

Etické komise to za pět deset dvacet let nebudou mít jednoduché. Snad jim dobře poradí přísedící umělá inteligence.