Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Diskuse k článku

„Málem jsem zabil bratra!“ Nový překladač je lepší, chyby jsou vtipnější

Jak si neuronové sítě Překladače Google poradí s češtinou? Otestovali jsme překladač na 135 větách a srovnali novou verzi se starou. Na první pohled je patrné nejen výrazné zlepšení, ale i zásadní změna způsobu, jak systém využívá neuronové sítě k překladu celých vět. Ve specifických situacích se ovšem ještě má co učit.

Upozornění

Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.

Zobrazit příspěvky: Všechny podle vláken Všechny podle času

L79u66k15á48š 87K58r71á10l 8868971407920

Staron's system :D

0/0
24.5.2017 15:30

V38á21c88l31a80v 50Š18u55b51r22t 9727913848427

Stále to ze všeho nejvíc připomíná legendárního Maďara v trafice od Pythonů:-)

0/0
14.5.2017 14:27

P33e11t81e47r 20M79l10i91c54h 8404412343585

Preklad prislovi je spravny, kdyz o prelozi doslovne. To jen ucitelky anglictiny nabyvaji dojemm, ze ma pouzit jednu z ceskych variant.

Predstavte si film, nejakou situaci, na kterou aplikuji osoby prislovi. Vy, kdyz pouzijete jine prislovi, tak nedava smysl pro danou situaci a neni vubec vtipne. A pritom vsichni ve filmu se osobe, co to anglicke prislovi rekla, zmeji, jako nejvtipnejsi poznamce na svete.

0/−1
13.5.2017 11:00
Foto

P33a27v28e81l 75K71a80s37í11k90, 84T74e48c32h62n23e16t73.30c15z

Není jeden správný způsob, jak přeložit takovou frázi. Musí se to dělat v kontextu.

0/0
16.5.2017 10:53

K64a56t88e61r76i28n39a 11M82a80t56t96h31e26w89s 3364694455101

Ten dotaznik pod clankem take, zda se, prosel prekladacem a vypada to na tu starsi verzi.

0/0
12.5.2017 18:51
Foto

P20a56v41e41l 25K17a97s86í27k86, 84T80e19c36h68n11e44t64.50c63z

Ano, prošel překladačem, a dokonce tou novou verzí. Šlo o ukázku toho, jak je si překladač poradí s běžnými i nezvyklými termíny. (Naivně jsem si myslel, že ten záměr byl zcela zřejmý.)

0/0
13.5.2017 8:37

J46o70s97e56f 54K92r63o57u58p94a 7911768165637

S umělou inteligencí mají lidi velké zkušenosti z úřadů.

0/0
12.5.2017 13:50

H72a73n32a 40P81r63o89k11o52p26o12v70á 8309380293811

Uf, z ruštiny колокольный звон (kolokol'nyj zvon) - což by mělo být asi zvonění zvonu - překládá do češtiny jako mýto, do polštiny myto, do němčiny Maut... přitom do angličtiny jako bell ringing... :-/

0/0
12.5.2017 0:49

H34o85n15z98a 39P21a10n85s47k61ý 3583492900340

Když už jsme u těch hříček s jazykem. Někde jsem četl souhrn asi 30 věcí, které byly pojmenovány ve stylu vysílačky (walkie talkie). Třeba potřesení rukou na schůzce bylo meetie greetie.

https://www.google.cz/amp/thechive.com/2015/11/26/if-the-guy-who-named-walkie-talkies-named-other-items-24-photos/amp/

0/0
11.5.2017 17:21

M19a78r26t46a 61D45o70u61b11r60a62v92o53v95á 4840334645437

Sorry jako, ale nejdřív musíte umět česky, aby se zobrazil správný překlad.

Příklad číslo 8 - máte místo "mě" slovo "mně", což úplně obrací smysl.

Když jsem do překladače zadala větu ve správném znění:

"Když odcházeli, málem mě, bratra a babičku zabili, protože domky v naší vesnici zapálili," vzpomínal po letech.

tak byla přeložena takto:

"When they left, they almost killed me and my brother and grandmother because they lit our houses in our village," he recalled for years.

0/0
11.5.2017 16:50

M75a33r19t85a 76D75o51u71b86r83a77v33o24v97á 4750424465847

aha, nevšimla jsem si, že už se tu o tom mluvilo. takže nic, jako bych nic nepsala.

+3/0
11.5.2017 16:54

M34i67r91e58k 29G33a34j52e16r 5841256259620

Dobre je videt, na jake urovni je ten novy jazykovy prekladac na prekladu tech 4 moznosti v ankete. Zbytecne jsem ucil cizi jazyky. Ostatne, co cekat, kdyz me za jejich vyuku nikdo neplatil.

0/0
11.5.2017 0:26

T82o28m 81S25t81r47a42k12o74š 7730747602918

Jestli Vám vyšlo to co mě, tak je to velmi kvalitní překlad. Manželka se ještě teď celá svíji v záchvatu smíchu.

0/0
10.5.2017 23:28

I38v86a62n85a 59N16o20v59a65k71o83v56a 2102842439702

zajimave, zkousela jsem kousek normalniho holandkeho txstu do cestiny. Preklad nedaval vubec smysl. To same pres anglictinu a vysledek perfektni.

0/0
10.5.2017 22:10
Foto

V89ě35r55a 34R11a59m50b97o26u38s10k44o19v59á 3925411660907

Ta vaše "vtipná" chyba tam byla, protože jste to měli špatně česky. Teď už IU zřejmě pochopila...

0/0
10.5.2017 21:47
Foto

P45a70v66e55l 77K14a65s95í21k44, 35T25e95c14h71n21e48t28.49c59z

Ta chyba v překladu tam byla bez ohledu na mně/mne. Stejně jako teď už tam není, bez ohledu na mně/mne. A chci taky připomenout, že to byla podstata testu: otestovat překladač v reálných podmínkách, na reálných textech.

0/0
10.5.2017 21:56

M42i86r87e46k 57G59a71j11e10r 5721406279640

Jestli ten prekladac vetsinou neni schopen rozlisit mně/mě, tak to bude hodne prakladu spatne. Doufejme jen, ze ten prekladac nebudou pouzivat vlady svetovych velmoci pri mezistatnich vyjednavanich. Mohlo by totiz brzo dojit ke sevetove valce.

0/0
11.5.2017 0:29
Foto

P63a23v75e24l 22K31a89s38í88k24, 25T81e29c33h38n32e70t41.52c80z

Nejde o to, že to neumí rozlišit, jde o to, že bere v potaz kontext věty.

0/0
11.5.2017 14:52

P33e13t56r34a 18K95o16v13á64ř33o80v26á 2690611811370

Díky za precizní článek. R^

+4/0
10.5.2017 21:40
Foto

K56a98r27e37l 21J69í27r70a 6164267331316

Zkuste si přeložit větu: Osuš si šosy. Anglický překlad Googlem zpětně přeložený do češtiny je opravdovou perlou...

+3/0
10.5.2017 21:35

T49o39m 67S30t58r92a60k16o88š 7660287152278

Jestli Vám vyšlo to co mě, tak je to velmi kvalitní překlad. Manželka se ještě teď celá svíjí smíchem.

0/0
10.5.2017 23:29

J34o14s18e96f 55K30a46r94f80í32k 7522135406210

Jo jo, hovíkno to překládá pořád;-D

0/0
11.5.2017 8:00

P16a42v50e17l 84S73t65a72v95j13a31n33í18k 6548925697381

Na "Dry your shit" mi nepřijde nic tak divného :-)

0/0
11.5.2017 0:57

D92u98š12a16n 60M29i25c84h79a37l50i26č86k63a 5889471869284

Tiež som sa riadne zarehlil..... R^

0/0
11.5.2017 20:25

F64i81l81i53p 49T54ř37e11b86a 6733460748536

Největší pokrok překladače Googlu bude, až se odkaz na něj vrátí na stránku s výsledky vyhledávání.

+2/0
10.5.2017 20:21
Foto

P35a51v39e52l 11K33a59s85í26k65, 37T56e33c49h85n42e23t83.46c88z

Nevím, jak to přesně myslíte, každopádně když vyhledáváte něco na Google, tak vedle výsledků, které jsou v jazyce, kterým nevládnete, je odkaz "Translate this page". Což je možná to, co chcete.

0/0
10.5.2017 20:41

T89o21m87á84š 53T54i73c15h73ý 3555777205362

Výborný článek!

Možná trpím profesionální deformací botanika:překvapuje mě, že překladač z kontextu zahrady nezvládl přeložit správně šeřík a hloh a místo plácá blbosti o barvě a trnu.

0/0
10.5.2017 20:07
Foto

P12a97v86e43l 62K64a86s10í11k98, 53T34e29c98h67n94e86t12.36c57z

Díky. Ano, ten kontext předchozí (statistická) verze překladače zvládala jen u sousloví, ale zvládla jej i tam, kde si nová verze (zatím) neporadí.

0/0
10.5.2017 20:54

W84a41l46t65e84r 97D36i28v84i39š 6487542102542

Zaujalo mne to hodnocení u překladu citace z Bible (list Korintským). V prvním případě vůbec nejde o skutečný počítačový překlad, je to téměř doslovně opsaný verš z ekumenického překladu Bible (Kdybych mluvil jazyky lidskými i andělskými, ale lásku bych neměl, jsem jenom dunící kov a zvučící zvon.). Řekl bych tedy, že stejně jako u přísloví se jedná o to, že tam někdo ručně doplnil lidský překlad a Google tento automaticky nabízel. Naproti tomu nová formulace je už skutečný překlad a ten kupodivu vůbec není špatný (až na podivný cinkál). Je tam sice posun Když/Kdyby, ale přesto je ještě pochopitelný smysl sdělení, což s ohledem na to, že Bible není exaktní encyklopedický text, je solidní.

Koneckonců z jazykového pohledu je docela zajímavé se občas podívat, jak se s překladem právě Bible potýkají velmi odlišně různé překlady (navíc v různých dobách). Ta kniha je překládána stovky let, z tohoto pohledu je to úžasný doklad vývoje jazyka. A rozdíl je občas do očí bijící. Viz třeba zmíněný verš v Bibli Kralické (1613): Bych jazyky lidskými mluvil i andělskými, a lásky kdybych neměl, učiněn jsem měď zvučící aneb zvonec znějící. V angličtině je mezi různými historickými překlady rozdíl velmi podobný jako v češtině. A překládat něco z trochu archaičtější angličtiny může být pro automatické překladače pořádný oříšek ještě dost dlouho (chybí dostatečná zásoba textů, na kterých se lze učit).

+2/0
10.5.2017 17:14
Foto

P34a62v51e78l 58K95a46s87í89k66, 62T65e54c85h77n27e70t28.30c34z

Samozřejmě, proto není článek jen výčtem hodnocení, ale jsou tam ty ukázky (plus PDF ke stažení), aby bylo zřejmé, v čem jsou silné a slabé stránky překladu, což není jednoduché kvantifikovat. Jinak Bible - právě proto, že je velmi pečlivě přeložena snad do všech světových jazyků - je jedním ze zdrojů podkladů pro statistický překladač, a nyní i pro neuronové sítě. Je to taková novodobá Rosettská deska, spolu například s dokumenty OSN. Takže starší verze překladače byla tak přesná i proto, že Bible v různých jazycích je jeden ze zdrojů těch dat, na kterých Google Translate už dlouhodobě staví.

+1/0
10.5.2017 20:39

M93i64r42e11k 45G35a46j11e69r 5621536539790

Novy prekladac je dobry, ale nemuze byt lepsi nez priklady, ze kterych se uci. Dovedu si predstavit, ze treba "rich odour of roses" nebude skoro nikde prelozeno spravne nebo je sprvnych prikladu malo. Podle me je to "silna vune ruzi". (Diakritiku si doplnte, namem ji tu.)

0/0
10.5.2017 17:07
Foto

J93i46ř26í 26D38v16o89ř68á93k 5745839100408

Samozřejmě to asi po dobu příštích několika desítek let nenahradí překladatele literatury (teda minimálně do doby, než stroje získají " cit " ), ale pro genaraci lidí, která se na škole učila s odporem ruštinu, je každé podobné zlepšení dobrou zprávou. Kupodivu i některá videa na " rouře " zvládají automatický překlad titulků . Třeba : https://www.youtube.com/watch?v=voNBzuI7IJ4.

+1/0
10.5.2017 17:06

J21a57r11o23s21l28a30v 16H88e91j60n16a 4527211939

Jenom jest míti obavy, že nový překladač pochytí něco z "češtiny" písálků iDnes nebo novostí Ústavu pro jazyk český.

+1/−1
10.5.2017 13:40

L75u35b45o23m81í70r 17K69a61m87e64n38s60k40ý 3290808423706

takže teď se už bude Google překladač sám učit a bude čím dál chytřejší?

0/0
10.5.2017 13:22
Foto

P33a77v45e87l 58Č43e33r46n90í12k 1848205720260

"sám" je nepřesné vyjádření.

On se samozřejmě bude učit sám, ale potřebuje zdroje, ze kterých se bude učit a jisté mantinely, které mu budou říkat, zda se učí dobře či špatně.

0/0
10.5.2017 17:17

L21u23b43o57m60í11r 38K32a51m95e22n58s81k66ý 3880858173596

tak zdrojů bude mít dostatek pokud bude používán a vzhledem k možnosti oprav a doporučení se najde i dost rádců. Pokud je to opravdu hluboká neuronová síť pak by nic víc neměl potřebovat.

0/0
10.5.2017 19:40

M89i81l74a75n 16V27o90l22e75k 5909683326599

Ano, umělá inteligence ale určité doby zjistí, že ji již lidé nemohou ničím obohatit a začne budoucnost určovat sama. Tedy tak vám to aspoň budou tvrdit.

0/−3
10.5.2017 18:49

M87i70r52o24s26l81a67v 78B13e47n81d80a 4323380758758

Zrovna včera jsem se pokoušel pomocí google překladače číst finský článek o nedělním zápasu s námi a co na mě vypadlo, bylo na a často za hranicí srozumitelnosti. A to bych řekl, že hokej není až tak složité téma.

+1/0
10.5.2017 12:05
Foto

P82a52v94e37l 97K49a15s95í52k45, 84T20e69c10h91n17e50t15.66c50z

Jak se to vezme. Hokej složité téma není, ale sportovní redaktor se pochopitelně snaží věty vyšperkovat, a používá tedy nestandardní obraty nebo metaforami. Tohle je z jednoho článku o hokeji na iDNES.cz: vyznamenal, prodloužil utrpení, zapsal, nabudil, promarnil, využil, manko, má na kontě, odložil.

Samozřejmě, kdyby ten text byl z tiskové agentury, tak s tím překladač problém nemá. Tam jsou obraty jako: zápas skončil za stavu, první gól dal, druhý gól dal, brankářem byl, byl vyloučen apod.

+7/0
10.5.2017 12:19

B17ř27e38t55i51s98l92a53v 76K50r24e77j25s17a 3254375317886

Všimněte si, že překlad Fin > Čj se děje stále ještě po slovech a je poměrně dost nesrozumitelný. Zkuste nastavit Fin > Aj a změní se na celé věty, které jsou podstatně smysluplnější.

Myslím si, že prostě nový translator nefunguje všude.

+1/0
10.5.2017 12:32

B30ř47e27t73i46s82l68a42v 47K89r72e80j33s18a 3354365427546

FIN > ČJ

Česká republika (TSEK. Česká republika), tj Českou republiku (TSEK. Česko), někdy také v České republice, je vnitrozemský stát ve střední Evropě. Sousedními zeměmijsou Německo, Rakousko, Slovensko a Polsko. Česká deset milionů obyvatel tvořídrtivá většina Čechů patří Slovany. Hlavní město země se nachází na řece Vltavě v Praze.

Česká republika se skládá z historických Čech, počet a ve Slezsku na jihu byla ve své historii, stejně jako součást habsburské monarchie v části 20. století Československa.V současné době patří Česká republika do Evropské unie a její cestovní pas bezSchengenského prostoru a NATO.

FIN > AJ + AJ > ČJ

Česká republika (Československo), Česká republika (Československo), někdy i Česká republika, je vnitrozemská země ve střední Evropě. Sousední státy jsou Německo, Rakousko, Slovensko a Polsko. Z deseti milionů obyvatel České republiky je velká většina Slovanů Češi. Hlavní město se nachází na řece Vltavě, v Praze.

V dějinách Čech, Määristä a jihovýchodní části Slezska je Česká republika součástí Habsburské říše a části Československa v 19. století. Dnes je Česká republika součástí Evropské unie a jejího schengenského prostoru bez pasů a NATO.

+2/0
10.5.2017 12:34

T95o52m38á14š 95T37a55t37í66č69e12k 5540712690288

Google i přes nasazení neuronových sítí pořád používá slovníky a databáze obsahující shodné texty v různých jazycích apod. Takže to má popis hokejového utkání těžší než třeba návod na mobil - články se nepřekládají jedna ku jedné, na rozdíl od návodů.

Jasně sepsané texty o technice, která je už alespoň pár měsíců běžná na trzích, mají v překladači velice dobré výsledky. Akorát teda se furt vyvíjí nový věci.

+1/0
10.5.2017 12:35
Foto

K29r66i49s75t69ý44n68a 23V13a18ň29k71o53v41á 3887500815623

Naučte se rozdíl mezi mě a mně a překladač si z vás nebude dělat kozy.

+3/−7
10.5.2017 11:11
Foto

P29a83v91e84l 34K20a71s45í78k23, 66T87e75c29h54n61e65t68.58c65z

V článku to vysvětluji: "Všimněte si překlepu v původní větě. Zachovali jsme jej z důvodu integrity testu, ve zdrojovém článku jsme ji ale již opravili. Na překlad neměl překlep vliv." A dále: "Mimochodem, chybu s „bratrovraždou“ již systém opravil..." Takže to shrnu ještě jednou: 1) Překlep "mně" místo "mne/mě" byl již v původním textu zdrojovém textu (brali jsme reálné texty, tedy včetně překlepů, chyb, neformálních výrazů apod.). 2) Nebylo by fér, abych v jedné verzi překladače předložil větu bez překlepu a jedné s překlepem, proto jsem překlep zachoval (v původním článku pana Pacnera jsem již ale překlep opravil). 3) Překladač v době testování přeložil stejně verzi s "mně" i "mě". 4) Nyní, dva týdny po testování, již Google opravil překlad, a to opět u obou verzí věty ("mně" i "mě").

Doufám, že je to nyní již jasné?

+6/0
10.5.2017 11:53
Foto

B96r85o81n49i29s83l33a82v 24G48a25b86r49y34š 2872769431

Ono je hlavne zakladem umet ten prekladac vubec pouzivat. Vim, ze je "hloupy", a proto tam nebudu psat slangove vyrazy a slozite vety. Vyraz "sto pade" bych tam urcite nenapsal. Jenze dost lidi neumi poradne cesky a nedokazou napsat vetu spravne tak, aby ta veta byla spravne prelozena.

0/−3
10.5.2017 11:05
Foto

P94a55v77e40l 90K31a12s35í37k87, 74T20e86c71h39n84e84t76.46c43z

Máte tedy pocit, že by překladač měl překládat jen spisovné věty, a kdykoli je v nich nespisovný výraz, tak má vyhodit chybu a říci "nespisovné výrazy nepřekládám"? To je přece nesmysl. A nejde o to, co byste "do překladače napsal", obvykle si překládáte něco, co napsal někdo jiný. Vždyť vy vlastně říkáte, že cizinec by neměl mít možnost dozvědět se, co znamená "sto pade" :-)

+4/0
10.5.2017 11:55
Foto

B72r10o10n37i56s96l62a36v 26G62a86b52r21y65š 2192909281

Ne, nemyslel jsem tím, že by to překladač neměl umožňovat. Je fajn, když si třeba najdu slangové výrazy v daném jazyce. Ale sám jistě dobře víte, že čím lepšími daty program nakrmíte, tím lepší máte výsledky. A tady je to podle mě stejný případ. Jenže řeč je pouze o angličtině, která je sama o sobě dost děsivá a chaotická.

Uvědomuju si jeho nedokonalost, a proto se v překladači raději vyjadřuju spisovně a v krátkých jednoduchých větách. Sám jsem měl s tímto přístupem problémy. Když jsem si nechal překládat teze disertační práce, použitím překladače bych ušetřil asi 6000 Kč. Problém byl v tom, že se vyjadřuju příliš složitě na to, aby to překladač pochopil. Bohužel se tohoto způsobu stále nemohu zbavit. Třeba si nemohl poradit s větou "Autor v problematice optimalizace linkového vedení v aglomeraci bude rovněž klást důraz na minimalizaci přestupních procesů za pomocí účelové funkce tak, aby byla zaručena jednoduchost a přehlednost celého systému v souvislosti s velikostí aglomerace.".

Zhruba před osmi lety jsem překládal titulky z angličtiny k jednomu filmu. Po částech jsem text kopíroval do překladače a ten měl odvahu překládat i citoslovce a jména. Např. citoslovce smíchu, které v anglických titulcích bylo napsáno jako "ha-ha" překladač přeložil jako "nízká zahradní zídka-nízká zahradní zídka". Ve filmu byla i postava jménem Rachel. Její překlad byl "světlehnědá barva".

Vůbec jsem nechtěl poukazovat na to, že by se do překladače měly psát jen spisové výrazy. Ale vzhledem k tomu, jak jsem už psal, že dost lidí neumí pořádně česky, nemůže od překladače na základě mizerných vstupů očekávat kvalitní výstupy. Ale předpokládám, že s dalším vývojem překladač chybu rozpozná a bude nějak tušit, co tím pisatel myslel.

0/−1
10.5.2017 13:25

J30o43s37e94f 84N71o50v45a62k 5538772806218

Ta vaše věta je nesrozumitelná i v češtině.

0/0
11.5.2017 6:40
Foto

B19r18o92n89i31s42l89a85v 41G14a87b31r33y53š 2752429471

Vědecká rada s ní problém neměla. Zkuste si ji rozpitvat.

0/0
11.5.2017 8:04







Najdete na iDNES.cz



mobilní verze
© 1999–2017 MAFRA, a. s., a dodavatelé Profimedia, Reuters, ČTK, AP. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s., zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s., se sídlem
Karla Engliše 519/11, 150 00 Praha 5, IČ: 45313351, zapsaná v obchodním rejstříku vedeném Městským soudem v Praze, oddíl B, vložka 1328. Vydavatelství MAFRA, a. s., je členem koncernu AGROFERT.