Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Diskuse k článku

„Málem jsem zabil bratra!“ Nový překladač je lepší, chyby jsou vtipnější

Jak si neuronové sítě Překladače Google poradí s češtinou? Otestovali jsme překladač na 135 větách a srovnali novou verzi se starou. Na první pohled je patrné nejen výrazné zlepšení, ale i zásadní změna způsobu, jak systém využívá neuronové sítě k překladu celých vět. Ve specifických situacích se ovšem ještě má co učit.

Upozornění

Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.

Zobrazit příspěvky: Všechny podle vláken Všechny podle času

L11u36k71á37š 77K19r25á74l 8578481587460

Staron's system :D

0/0
24.5.2017 15:30

V52á65c90l77a40v 74Š93u67b22r80t 9157123778587

Stále to ze všeho nejvíc připomíná legendárního Maďara v trafice od Pythonů:-)

0/0
14.5.2017 14:27

P48e66t51e78r 88M30l38i64c82h 8244402953825

Preklad prislovi je spravny, kdyz o prelozi doslovne. To jen ucitelky anglictiny nabyvaji dojemm, ze ma pouzit jednu z ceskych variant.

Predstavte si film, nejakou situaci, na kterou aplikuji osoby prislovi. Vy, kdyz pouzijete jine prislovi, tak nedava smysl pro danou situaci a neni vubec vtipne. A pritom vsichni ve filmu se osobe, co to anglicke prislovi rekla, zmeji, jako nejvtipnejsi poznamce na svete.

0/−1
13.5.2017 11:00
Foto

P55a60v29e36l 28K75a94s33í77k12, 23T45e27c25h61n70e63t83.16c45z

Není jeden správný způsob, jak přeložit takovou frázi. Musí se to dělat v kontextu.

0/0
16.5.2017 10:53

K10a78t50e79r88i36n76a 40M49a87t42t38h72e33w25s 3784914525491

Ten dotaznik pod clankem take, zda se, prosel prekladacem a vypada to na tu starsi verzi.

0/0
12.5.2017 18:51
Foto

P29a62v28e52l 82K94a28s69í93k20, 88T87e90c61h92n69e20t42.13c73z

Ano, prošel překladačem, a dokonce tou novou verzí. Šlo o ukázku toho, jak je si překladač poradí s běžnými i nezvyklými termíny. (Naivně jsem si myslel, že ten záměr byl zcela zřejmý.)

0/0
13.5.2017 8:37

J56o22s20e26f 42K12r43o94u46p36a 7351938325437

S umělou inteligencí mají lidi velké zkušenosti z úřadů.

0/0
12.5.2017 13:50

H28a12n71a 15P26r64o20k44o34p90o29v34á 8249840893371

Uf, z ruštiny колокольный звон (kolokol'nyj zvon) - což by mělo být asi zvonění zvonu - překládá do češtiny jako mýto, do polštiny myto, do němčiny Maut... přitom do angličtiny jako bell ringing... :-/

0/0
12.5.2017 0:49

H95o18n96z42a 60P41a71n65s58k22ý 3843842660290

Když už jsme u těch hříček s jazykem. Někde jsem četl souhrn asi 30 věcí, které byly pojmenovány ve stylu vysílačky (walkie talkie). Třeba potřesení rukou na schůzce bylo meetie greetie.

https://www.google.cz/amp/thechive.com/2015/11/26/if-the-guy-who-named-walkie-talkies-named-other-items-24-photos/amp/

0/0
11.5.2017 17:21
Foto

M62a75r76t73a 29D90o36u24b95r75a47v62o88v76á 4970394395377

Sorry jako, ale nejdřív musíte umět česky, aby se zobrazil správný překlad.

Příklad číslo 8 - máte místo "mě" slovo "mně", což úplně obrací smysl.

Když jsem do překladače zadala větu ve správném znění:

"Když odcházeli, málem mě, bratra a babičku zabili, protože domky v naší vesnici zapálili," vzpomínal po letech.

tak byla přeložena takto:

"When they left, they almost killed me and my brother and grandmother because they lit our houses in our village," he recalled for years.

0/0
11.5.2017 16:50
Foto

M77a80r26t90a 68D41o24u93b87r85a25v88o68v11á 4460914405867

aha, nevšimla jsem si, že už se tu o tom mluvilo. takže nic, jako bych nic nepsala.

+3/0
11.5.2017 16:54

M62i58r35e76k 52G21a51j77e78r 5831646969460

Dobre je videt, na jake urovni je ten novy jazykovy prekladac na prekladu tech 4 moznosti v ankete. Zbytecne jsem ucil cizi jazyky. Ostatne, co cekat, kdyz me za jejich vyuku nikdo neplatil.

0/0
11.5.2017 0:26

T67o85m 69S87t89r81a98k86o98š 7750887602978

Jestli Vám vyšlo to co mě, tak je to velmi kvalitní překlad. Manželka se ještě teď celá svíji v záchvatu smíchu.

0/0
10.5.2017 23:28

I45v25a59n56a 93N57o61v14a51k52o21v88a 2222242549762

zajimave, zkousela jsem kousek normalniho holandkeho txstu do cestiny. Preklad nedaval vubec smysl. To same pres anglictinu a vysledek perfektni.

0/0
10.5.2017 22:10
Foto

V11ě36r40a 39R59a47m45b56o59u67s22k55o32v64á 3215671890817

Ta vaše "vtipná" chyba tam byla, protože jste to měli špatně česky. Teď už IU zřejmě pochopila...

0/0
10.5.2017 21:47
Foto

P32a60v95e79l 95K64a31s56í16k86, 34T72e39c34h15n39e47t71.46c18z

Ta chyba v překladu tam byla bez ohledu na mně/mne. Stejně jako teď už tam není, bez ohledu na mně/mne. A chci taky připomenout, že to byla podstata testu: otestovat překladač v reálných podmínkách, na reálných textech.

0/0
10.5.2017 21:56

M85i56r12e45k 11G26a55j35e72r 5211916739530

Jestli ten prekladac vetsinou neni schopen rozlisit mně/mě, tak to bude hodne prakladu spatne. Doufejme jen, ze ten prekladac nebudou pouzivat vlady svetovych velmoci pri mezistatnich vyjednavanich. Mohlo by totiz brzo dojit ke sevetove valce.

0/0
11.5.2017 0:29
Foto

P64a63v85e63l 54K14a75s27í91k56, 62T34e97c71h42n58e66t43.63c61z

Nejde o to, že to neumí rozlišit, jde o to, že bere v potaz kontext věty.

0/0
11.5.2017 14:52

P12e57t58r31a 70K73o66v27á59ř19o96v10á 2770701931330

Díky za precizní článek. R^

+4/0
10.5.2017 21:40
Foto

K87a82r22e97l 35J25í22r12a 6464807251626

Zkuste si přeložit větu: Osuš si šosy. Anglický překlad Googlem zpětně přeložený do češtiny je opravdovou perlou...

+3/0
10.5.2017 21:35

T11o30m 95S92t10r26a89k40o64š 7230317942478

Jestli Vám vyšlo to co mě, tak je to velmi kvalitní překlad. Manželka se ještě teď celá svíjí smíchem.

0/0
10.5.2017 23:29

J42o62s40e54f 15K74a76r11f67í91k 7482825536630

Jo jo, hovíkno to překládá pořád;-D

0/0
11.5.2017 8:00

P11a79v87e37l 47S85t82a15v60j83a81n87í74k 6338225177351

Na "Dry your shit" mi nepřijde nic tak divného :-)

0/0
11.5.2017 0:57

D81u90š12a42n 25M95i22c15h26a11l40i15č82k63a 5399691719844

Tiež som sa riadne zarehlil..... R^

0/0
11.5.2017 20:25

F65i87l21i63p 13T97ř58e18b75a 6523340858496

Největší pokrok překladače Googlu bude, až se odkaz na něj vrátí na stránku s výsledky vyhledávání.

+2/0
10.5.2017 20:21
Foto

P63a80v18e43l 32K69a81s23í15k64, 25T39e60c11h23n58e51t65.90c61z

Nevím, jak to přesně myslíte, každopádně když vyhledáváte něco na Google, tak vedle výsledků, které jsou v jazyce, kterým nevládnete, je odkaz "Translate this page". Což je možná to, co chcete.

0/0
10.5.2017 20:41

T27o95m15á93š 75T18i47c12h54ý 3345377495372

Výborný článek!

Možná trpím profesionální deformací botanika:překvapuje mě, že překladač z kontextu zahrady nezvládl přeložit správně šeřík a hloh a místo plácá blbosti o barvě a trnu.

0/0
10.5.2017 20:07
Foto

P89a76v11e83l 14K30a92s29í59k79, 48T57e81c94h63n36e48t93.38c29z

Díky. Ano, ten kontext předchozí (statistická) verze překladače zvládala jen u sousloví, ale zvládla jej i tam, kde si nová verze (zatím) neporadí.

0/0
10.5.2017 20:54

W31a34l34t30e16r 29D73i28v25i31š 6527462292332

Zaujalo mne to hodnocení u překladu citace z Bible (list Korintským). V prvním případě vůbec nejde o skutečný počítačový překlad, je to téměř doslovně opsaný verš z ekumenického překladu Bible (Kdybych mluvil jazyky lidskými i andělskými, ale lásku bych neměl, jsem jenom dunící kov a zvučící zvon.). Řekl bych tedy, že stejně jako u přísloví se jedná o to, že tam někdo ručně doplnil lidský překlad a Google tento automaticky nabízel. Naproti tomu nová formulace je už skutečný překlad a ten kupodivu vůbec není špatný (až na podivný cinkál). Je tam sice posun Když/Kdyby, ale přesto je ještě pochopitelný smysl sdělení, což s ohledem na to, že Bible není exaktní encyklopedický text, je solidní.

Koneckonců z jazykového pohledu je docela zajímavé se občas podívat, jak se s překladem právě Bible potýkají velmi odlišně různé překlady (navíc v různých dobách). Ta kniha je překládána stovky let, z tohoto pohledu je to úžasný doklad vývoje jazyka. A rozdíl je občas do očí bijící. Viz třeba zmíněný verš v Bibli Kralické (1613): Bych jazyky lidskými mluvil i andělskými, a lásky kdybych neměl, učiněn jsem měď zvučící aneb zvonec znějící. V angličtině je mezi různými historickými překlady rozdíl velmi podobný jako v češtině. A překládat něco z trochu archaičtější angličtiny může být pro automatické překladače pořádný oříšek ještě dost dlouho (chybí dostatečná zásoba textů, na kterých se lze učit).

+2/0
10.5.2017 17:14
Foto

P65a34v15e20l 48K20a66s34í77k67, 25T27e74c33h43n80e61t15.77c69z

Samozřejmě, proto není článek jen výčtem hodnocení, ale jsou tam ty ukázky (plus PDF ke stažení), aby bylo zřejmé, v čem jsou silné a slabé stránky překladu, což není jednoduché kvantifikovat. Jinak Bible - právě proto, že je velmi pečlivě přeložena snad do všech světových jazyků - je jedním ze zdrojů podkladů pro statistický překladač, a nyní i pro neuronové sítě. Je to taková novodobá Rosettská deska, spolu například s dokumenty OSN. Takže starší verze překladače byla tak přesná i proto, že Bible v různých jazycích je jeden ze zdrojů těch dat, na kterých Google Translate už dlouhodobě staví.

+1/0
10.5.2017 20:39

M88i41r93e15k 29G77a81j97e89r 5391576239320

Novy prekladac je dobry, ale nemuze byt lepsi nez priklady, ze kterych se uci. Dovedu si predstavit, ze treba "rich odour of roses" nebude skoro nikde prelozeno spravne nebo je sprvnych prikladu malo. Podle me je to "silna vune ruzi". (Diakritiku si doplnte, namem ji tu.)

0/0
10.5.2017 17:07
Foto

J60i88ř44í 61D29v78o16ř75á83k 5155109630808

Samozřejmě to asi po dobu příštích několika desítek let nenahradí překladatele literatury (teda minimálně do doby, než stroje získají " cit " ), ale pro genaraci lidí, která se na škole učila s odporem ruštinu, je každé podobné zlepšení dobrou zprávou. Kupodivu i některá videa na " rouře " zvládají automatický překlad titulků . Třeba : https://www.youtube.com/watch?v=voNBzuI7IJ4.

+1/0
10.5.2017 17:06

J23a62r78o14s64l28a68v 60H18e48j59n81a 4767671589

Jenom jest míti obavy, že nový překladač pochytí něco z "češtiny" písálků iDnes nebo novostí Ústavu pro jazyk český.

+1/−1
10.5.2017 13:40

L60u56b18o77m82í32r 68K13a64m98e62n24s47k21ý 3740198423266

takže teď se už bude Google překladač sám učit a bude čím dál chytřejší?

0/0
10.5.2017 13:22
Foto

P84a26v61e29l 83Č63e72r18n32í95k 1178305970500

"sám" je nepřesné vyjádření.

On se samozřejmě bude učit sám, ale potřebuje zdroje, ze kterých se bude učit a jisté mantinely, které mu budou říkat, zda se učí dobře či špatně.

0/0
10.5.2017 17:17

L74u50b57o25m53í91r 25K30a41m85e21n54s13k71ý 3600818343266

tak zdrojů bude mít dostatek pokud bude používán a vzhledem k možnosti oprav a doporučení se najde i dost rádců. Pokud je to opravdu hluboká neuronová síť pak by nic víc neměl potřebovat.

0/0
10.5.2017 19:40

M89i77l21a68n 95V46o18l95e13k 5739883526279

Ano, umělá inteligence ale určité doby zjistí, že ji již lidé nemohou ničím obohatit a začne budoucnost určovat sama. Tedy tak vám to aspoň budou tvrdit.

0/−3
10.5.2017 18:49

M48i46r42o40s82l47a66v 85B46e18n64d27a 4213540428158

Zrovna včera jsem se pokoušel pomocí google překladače číst finský článek o nedělním zápasu s námi a co na mě vypadlo, bylo na a často za hranicí srozumitelnosti. A to bych řekl, že hokej není až tak složité téma.

+1/0
10.5.2017 12:05
Foto

P84a64v70e66l 98K40a62s73í52k58, 66T62e63c78h60n36e47t59.72c31z

Jak se to vezme. Hokej složité téma není, ale sportovní redaktor se pochopitelně snaží věty vyšperkovat, a používá tedy nestandardní obraty nebo metaforami. Tohle je z jednoho článku o hokeji na iDNES.cz: vyznamenal, prodloužil utrpení, zapsal, nabudil, promarnil, využil, manko, má na kontě, odložil.

Samozřejmě, kdyby ten text byl z tiskové agentury, tak s tím překladač problém nemá. Tam jsou obraty jako: zápas skončil za stavu, první gól dal, druhý gól dal, brankářem byl, byl vyloučen apod.

+7/0
10.5.2017 12:19

B62ř15e35t58i45s87l52a44v 62K30r35e87j96s76a 3894125547646

Všimněte si, že překlad Fin > Čj se děje stále ještě po slovech a je poměrně dost nesrozumitelný. Zkuste nastavit Fin > Aj a změní se na celé věty, které jsou podstatně smysluplnější.

Myslím si, že prostě nový translator nefunguje všude.

+1/0
10.5.2017 12:32

B31ř75e15t81i34s94l30a91v 92K72r81e55j34s47a 3854695797316

FIN > ČJ

Česká republika (TSEK. Česká republika), tj Českou republiku (TSEK. Česko), někdy také v České republice, je vnitrozemský stát ve střední Evropě. Sousedními zeměmijsou Německo, Rakousko, Slovensko a Polsko. Česká deset milionů obyvatel tvořídrtivá většina Čechů patří Slovany. Hlavní město země se nachází na řece Vltavě v Praze.

Česká republika se skládá z historických Čech, počet a ve Slezsku na jihu byla ve své historii, stejně jako součást habsburské monarchie v části 20. století Československa.V současné době patří Česká republika do Evropské unie a její cestovní pas bezSchengenského prostoru a NATO.

FIN > AJ + AJ > ČJ

Česká republika (Československo), Česká republika (Československo), někdy i Česká republika, je vnitrozemská země ve střední Evropě. Sousední státy jsou Německo, Rakousko, Slovensko a Polsko. Z deseti milionů obyvatel České republiky je velká většina Slovanů Češi. Hlavní město se nachází na řece Vltavě, v Praze.

V dějinách Čech, Määristä a jihovýchodní části Slezska je Česká republika součástí Habsburské říše a části Československa v 19. století. Dnes je Česká republika součástí Evropské unie a jejího schengenského prostoru bez pasů a NATO.

+2/0
10.5.2017 12:34

T11o91m16á71š 92T13a11t30í95č60e37k 5150422710838

Google i přes nasazení neuronových sítí pořád používá slovníky a databáze obsahující shodné texty v různých jazycích apod. Takže to má popis hokejového utkání těžší než třeba návod na mobil - články se nepřekládají jedna ku jedné, na rozdíl od návodů.

Jasně sepsané texty o technice, která je už alespoň pár měsíců běžná na trzích, mají v překladači velice dobré výsledky. Akorát teda se furt vyvíjí nový věci.

+1/0
10.5.2017 12:35
Foto

K12r95i51s95t73ý18n57a 67V43a42ň86k23o86v25á 3527620125563

Naučte se rozdíl mezi mě a mně a překladač si z vás nebude dělat kozy.

+3/−7
10.5.2017 11:11
Foto

P96a18v81e82l 74K50a67s94í64k24, 97T90e11c66h19n62e31t45.64c73z

V článku to vysvětluji: "Všimněte si překlepu v původní větě. Zachovali jsme jej z důvodu integrity testu, ve zdrojovém článku jsme ji ale již opravili. Na překlad neměl překlep vliv." A dále: "Mimochodem, chybu s „bratrovraždou“ již systém opravil..." Takže to shrnu ještě jednou: 1) Překlep "mně" místo "mne/mě" byl již v původním textu zdrojovém textu (brali jsme reálné texty, tedy včetně překlepů, chyb, neformálních výrazů apod.). 2) Nebylo by fér, abych v jedné verzi překladače předložil větu bez překlepu a jedné s překlepem, proto jsem překlep zachoval (v původním článku pana Pacnera jsem již ale překlep opravil). 3) Překladač v době testování přeložil stejně verzi s "mně" i "mě". 4) Nyní, dva týdny po testování, již Google opravil překlad, a to opět u obou verzí věty ("mně" i "mě").

Doufám, že je to nyní již jasné?

+6/0
10.5.2017 11:53
Foto

B29r93o95n58i43s86l89a16v 58G34a31b52r79y46š 2982399951

Ono je hlavne zakladem umet ten prekladac vubec pouzivat. Vim, ze je "hloupy", a proto tam nebudu psat slangove vyrazy a slozite vety. Vyraz "sto pade" bych tam urcite nenapsal. Jenze dost lidi neumi poradne cesky a nedokazou napsat vetu spravne tak, aby ta veta byla spravne prelozena.

0/−3
10.5.2017 11:05
Foto

P88a19v35e52l 21K15a10s70í34k60, 14T47e45c57h56n97e86t57.16c17z

Máte tedy pocit, že by překladač měl překládat jen spisovné věty, a kdykoli je v nich nespisovný výraz, tak má vyhodit chybu a říci "nespisovné výrazy nepřekládám"? To je přece nesmysl. A nejde o to, co byste "do překladače napsal", obvykle si překládáte něco, co napsal někdo jiný. Vždyť vy vlastně říkáte, že cizinec by neměl mít možnost dozvědět se, co znamená "sto pade" :-)

+4/0
10.5.2017 11:55
Foto

B24r72o22n28i31s40l90a94v 14G94a52b32r32y71š 2252859401

Ne, nemyslel jsem tím, že by to překladač neměl umožňovat. Je fajn, když si třeba najdu slangové výrazy v daném jazyce. Ale sám jistě dobře víte, že čím lepšími daty program nakrmíte, tím lepší máte výsledky. A tady je to podle mě stejný případ. Jenže řeč je pouze o angličtině, která je sama o sobě dost děsivá a chaotická.

Uvědomuju si jeho nedokonalost, a proto se v překladači raději vyjadřuju spisovně a v krátkých jednoduchých větách. Sám jsem měl s tímto přístupem problémy. Když jsem si nechal překládat teze disertační práce, použitím překladače bych ušetřil asi 6000 Kč. Problém byl v tom, že se vyjadřuju příliš složitě na to, aby to překladač pochopil. Bohužel se tohoto způsobu stále nemohu zbavit. Třeba si nemohl poradit s větou "Autor v problematice optimalizace linkového vedení v aglomeraci bude rovněž klást důraz na minimalizaci přestupních procesů za pomocí účelové funkce tak, aby byla zaručena jednoduchost a přehlednost celého systému v souvislosti s velikostí aglomerace.".

Zhruba před osmi lety jsem překládal titulky z angličtiny k jednomu filmu. Po částech jsem text kopíroval do překladače a ten měl odvahu překládat i citoslovce a jména. Např. citoslovce smíchu, které v anglických titulcích bylo napsáno jako "ha-ha" překladač přeložil jako "nízká zahradní zídka-nízká zahradní zídka". Ve filmu byla i postava jménem Rachel. Její překlad byl "světlehnědá barva".

Vůbec jsem nechtěl poukazovat na to, že by se do překladače měly psát jen spisové výrazy. Ale vzhledem k tomu, jak jsem už psal, že dost lidí neumí pořádně česky, nemůže od překladače na základě mizerných vstupů očekávat kvalitní výstupy. Ale předpokládám, že s dalším vývojem překladač chybu rozpozná a bude nějak tušit, co tím pisatel myslel.

0/−1
10.5.2017 13:25

J77o94s22e28f 51N63o27v45a41k 5358272366268

Ta vaše věta je nesrozumitelná i v češtině.

0/0
11.5.2017 6:40
Foto

B17r90o53n21i64s90l50a49v 13G44a10b48r29y89š 2452929281

Vědecká rada s ní problém neměla. Zkuste si ji rozpitvat.

0/0
11.5.2017 8:04



Najdete na iDNES.cz