DeepL: překlad s glosářem

U svých komentovaných paraglidingových přeletů mám české titulky. Ty se přímo na YouTube dají přeložit do angličtiny, ale funguje to dost žalostně. Jednak Google Translate asi dnes není ten úplně nejlepší překladač a jednak v paraglidingu používáme celkem velký žargon – určitě přes sto pojmů, které buď normální smrtelník vůbec nezná nebo mají v běžné řeči jiný význam. Pár ukázek:

stoupák
stoupavý termický proud
prostor
letecký prostor
vyhnít
neplánovaně ukončit termický přelet

Zkusil jsem na překlad použít DeepL, což trochu pomohlo, ale hlavní problém se žargonem zůstal. Nicméně DeepL umožňuje definovat vlastní slovník pojmů (glosář), kterým by mělo jít tento problém vyřešit.

Nejprve jsem si své titulky stáhl. YouTube API vytrvale vrací 404, tak posloužil starý dobrý yt-dlp s volbami --skip-download --write-subs.

Pak je potřeba na DeepL zapnout nějaký plán (např. API free) a vygenerovat API klíč. S tímto klíčem už se dá povídat s DeepL API pro PHP. Můžeme si vytvořit a použít vlastní glosář:

<?php
$deeplClient = new \DeepL\DeepLClient($authKey);
$entries = \DeepL\GlossaryEntries::fromTsv(file_get_contents("glossary.tsv"));
$glossaryId = $deeplClient->createGlossary('Paragliding', 'cs', 'en', $entries)->glossaryId;
echo $deeplClient->translateText($text, 'cs', 'en-US', ['glossary' => $glossaryId]);
?>

Funguje to skvěle. Zatímco původní překlady byly prakticky nečitelné, nové překlady mapují český žargon na anglický žargon a anglicky mluvící paraglidista jim bude rozumět. Pár ukázek:

CSCelkem rychle po startu se mi daří chytit čtyřkový integrovaný stoupák.
ENI manage to catch the quad integrated climb quite quickly after take-off.
EN-gQuite quickly after the takeoff I manage to catch the four m/s integrated thermal.

CSVytočím pod mrak, vyhlídnu si další, letím k němu a takhle pořád dokola.
ENI dial under a cloud, look for another one, fly towards it, and keep going like that.
EN-gI thermal under a cloud, look for another one, fly towards it, and keep going like that.

CSJsem už mimo prostor, tak to jde zase dobře.
ENI'm out of space now, so it's going well again.
EN-gI'm out of airspace now, so it's going well again.
Jakub Vrána, Seznámení s oblastí, 10.3.2025, diskuse: 0 (nové: 0)

Vložit komentář

Používejte diakritiku. Vstup se chápe jako čistý text, ale URL budou převedeny na odkazy a PHP kód uzavřený do <?php ?> bude zvýrazněn. Pokud máte dotaz, který nesouvisí s článkem, zkuste raději diskusi o PHP, zde se odpovědi pravděpodobně nedočkáte.

Jméno: URL:

avatar © 2005-2025 Jakub Vrána. Publikované texty můžete přetiskovat pouze se svolením autora. Ukázky kódu smíte používat s uvedením autora a URL tohoto webu bez dalších omezení Creative Commons. Můžeme si tykat. Skripty předpokládají nastavení: magic_quotes_gpc=Off, magic_quotes_runtime=Off, error_reporting=E_ALL & ~E_NOTICE a očekávají předchozí zavolání mysql_set_charset. Skripty by měly být funkční v PHP >= 4.3 a PHP >= 5.0.