Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Diskuse k článku

„Málem jsem zabil bratra!“ Nový překladač je lepší, chyby jsou vtipnější

Jak si neuronové sítě Překladače Google poradí s češtinou? Otestovali jsme překladač na 135 větách a srovnali novou verzi se starou. Na první pohled je patrné nejen výrazné zlepšení, ale i zásadní změna způsobu, jak systém využívá neuronové sítě k překladu celých vět. Ve specifických situacích se ovšem ještě má co učit.

Upozornění

Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.

Zobrazit příspěvky: Všechny podle vláken Všechny podle času

L28u18k16á42š 28K14r72á60l 8128221807530

Staron's system :D

0/0
24.5.2017 15:30

V62á23c42l95a35v 55Š82u18b53r92t 9647953448287

Stále to ze všeho nejvíc připomíná legendárního Maďara v trafice od Pythonů:-)

0/0
14.5.2017 14:27

P65e81t94e59r 21M73l42i45c75h 8874742203355

Preklad prislovi je spravny, kdyz o prelozi doslovne. To jen ucitelky anglictiny nabyvaji dojemm, ze ma pouzit jednu z ceskych variant.

Predstavte si film, nejakou situaci, na kterou aplikuji osoby prislovi. Vy, kdyz pouzijete jine prislovi, tak nedava smysl pro danou situaci a neni vubec vtipne. A pritom vsichni ve filmu se osobe, co to anglicke prislovi rekla, zmeji, jako nejvtipnejsi poznamce na svete.

0/−1
13.5.2017 11:00
Foto

P56a42v46e55l 34K98a65s13í67k53, 41T85e27c66h72n80e83t88.49c59z

Není jeden správný způsob, jak přeložit takovou frázi. Musí se to dělat v kontextu.

0/0
16.5.2017 10:53

K32a53t60e86r69i76n14a 65M87a12t16t49h92e18w36s 3824544375601

Ten dotaznik pod clankem take, zda se, prosel prekladacem a vypada to na tu starsi verzi.

0/0
12.5.2017 18:51
Foto

P38a89v86e79l 64K38a86s40í89k53, 94T26e65c31h59n47e86t64.42c89z

Ano, prošel překladačem, a dokonce tou novou verzí. Šlo o ukázku toho, jak je si překladač poradí s běžnými i nezvyklými termíny. (Naivně jsem si myslel, že ten záměr byl zcela zřejmý.)

0/0
13.5.2017 8:37

J46o95s58e63f 74K44r14o12u71p38a 7211528925127

S umělou inteligencí mají lidi velké zkušenosti z úřadů.

0/0
12.5.2017 13:50

H69a94n92a 66P29r96o25k80o87p10o66v51á 8679610373751

Uf, z ruštiny колокольный звон (kolokol'nyj zvon) - což by mělo být asi zvonění zvonu - překládá do češtiny jako mýto, do polštiny myto, do němčiny Maut... přitom do angličtiny jako bell ringing... :-/

0/0
12.5.2017 0:49

H45o45n57z77a 96P62a55n81s76k91ý 3983752870950

Když už jsme u těch hříček s jazykem. Někde jsem četl souhrn asi 30 věcí, které byly pojmenovány ve stylu vysílačky (walkie talkie). Třeba potřesení rukou na schůzce bylo meetie greetie.

https://www.google.cz/amp/thechive.com/2015/11/26/if-the-guy-who-named-walkie-talkies-named-other-items-24-photos/amp/

0/0
11.5.2017 17:21

M50a35r30t71a 63D40o50u70b83r53a89v79o53v90á 4110464685677

Sorry jako, ale nejdřív musíte umět česky, aby se zobrazil správný překlad.

Příklad číslo 8 - máte místo "mě" slovo "mně", což úplně obrací smysl.

Když jsem do překladače zadala větu ve správném znění:

"Když odcházeli, málem mě, bratra a babičku zabili, protože domky v naší vesnici zapálili," vzpomínal po letech.

tak byla přeložena takto:

"When they left, they almost killed me and my brother and grandmother because they lit our houses in our village," he recalled for years.

0/0
11.5.2017 16:50

M65a24r60t24a 88D47o29u92b12r92a89v41o10v74á 4550664375127

aha, nevšimla jsem si, že už se tu o tom mluvilo. takže nic, jako bych nic nepsala.

+3/0
11.5.2017 16:54

M21i27r90e53k 32G55a65j13e86r 5941266859230

Dobre je videt, na jake urovni je ten novy jazykovy prekladac na prekladu tech 4 moznosti v ankete. Zbytecne jsem ucil cizi jazyky. Ostatne, co cekat, kdyz me za jejich vyuku nikdo neplatil.

0/0
11.5.2017 0:26

T20o77m 48S60t97r58a31k41o28š 7770737972498

Jestli Vám vyšlo to co mě, tak je to velmi kvalitní překlad. Manželka se ještě teď celá svíji v záchvatu smíchu.

0/0
10.5.2017 23:28

I95v37a85n61a 77N42o72v20a92k45o22v10a 2202722289722

zajimave, zkousela jsem kousek normalniho holandkeho txstu do cestiny. Preklad nedaval vubec smysl. To same pres anglictinu a vysledek perfektni.

0/0
10.5.2017 22:10
Foto

V60ě15r81a 34R54a39m42b51o52u23s48k59o38v22á 3765941250457

Ta vaše "vtipná" chyba tam byla, protože jste to měli špatně česky. Teď už IU zřejmě pochopila...

0/0
10.5.2017 21:47
Foto

P92a86v70e23l 84K33a49s11í19k66, 74T42e35c97h25n59e92t33.43c64z

Ta chyba v překladu tam byla bez ohledu na mně/mne. Stejně jako teď už tam není, bez ohledu na mně/mne. A chci taky připomenout, že to byla podstata testu: otestovat překladač v reálných podmínkách, na reálných textech.

0/0
10.5.2017 21:56

M96i52r24e47k 12G49a29j94e25r 5761106299230

Jestli ten prekladac vetsinou neni schopen rozlisit mně/mě, tak to bude hodne prakladu spatne. Doufejme jen, ze ten prekladac nebudou pouzivat vlady svetovych velmoci pri mezistatnich vyjednavanich. Mohlo by totiz brzo dojit ke sevetove valce.

0/0
11.5.2017 0:29
Foto

P48a59v43e48l 20K14a72s66í78k96, 17T53e36c63h54n35e93t57.78c51z

Nejde o to, že to neumí rozlišit, jde o to, že bere v potaz kontext věty.

0/0
11.5.2017 14:52

P11e96t89r46a 51K27o69v55á49ř80o94v28á 2250971851860

Díky za precizní článek. R^

+4/0
10.5.2017 21:40
Foto

K21a85r36e53l 46J57í53r25a 6594917761556

Zkuste si přeložit větu: Osuš si šosy. Anglický překlad Googlem zpětně přeložený do češtiny je opravdovou perlou...

+3/0
10.5.2017 21:35

T71o26m 72S74t13r39a76k96o41š 7730927702338

Jestli Vám vyšlo to co mě, tak je to velmi kvalitní překlad. Manželka se ještě teď celá svíjí smíchem.

0/0
10.5.2017 23:29

J76o48s63e97f 30K65a25r76f28í80k 7562985356350

Jo jo, hovíkno to překládá pořád;-D

0/0
11.5.2017 8:00

P50a15v23e89l 78S11t95a79v45j51a28n30í82k 6338925267871

Na "Dry your shit" mi nepřijde nic tak divného :-)

0/0
11.5.2017 0:57

D19u86š89a48n 36M86i10c81h72a94l98i71č89k46a 5349971259854

Tiež som sa riadne zarehlil..... R^

0/0
11.5.2017 20:25

F27i39l77i22p 34T80ř57e28b79a 6733370498376

Největší pokrok překladače Googlu bude, až se odkaz na něj vrátí na stránku s výsledky vyhledávání.

+2/0
10.5.2017 20:21
Foto

P67a41v90e18l 72K47a35s67í41k28, 90T17e20c58h55n47e35t42.12c53z

Nevím, jak to přesně myslíte, každopádně když vyhledáváte něco na Google, tak vedle výsledků, které jsou v jazyce, kterým nevládnete, je odkaz "Translate this page". Což je možná to, co chcete.

0/0
10.5.2017 20:41

T55o80m90á16š 61T68i20c73h98ý 3475717245412

Výborný článek!

Možná trpím profesionální deformací botanika:překvapuje mě, že překladač z kontextu zahrady nezvládl přeložit správně šeřík a hloh a místo plácá blbosti o barvě a trnu.

0/0
10.5.2017 20:07
Foto

P13a90v98e52l 21K65a65s96í94k20, 28T28e65c85h55n25e25t35.28c55z

Díky. Ano, ten kontext předchozí (statistická) verze překladače zvládala jen u sousloví, ale zvládla jej i tam, kde si nová verze (zatím) neporadí.

0/0
10.5.2017 20:54

W57a31l16t71e79r 43D72i98v63i53š 6987242982182

Zaujalo mne to hodnocení u překladu citace z Bible (list Korintským). V prvním případě vůbec nejde o skutečný počítačový překlad, je to téměř doslovně opsaný verš z ekumenického překladu Bible (Kdybych mluvil jazyky lidskými i andělskými, ale lásku bych neměl, jsem jenom dunící kov a zvučící zvon.). Řekl bych tedy, že stejně jako u přísloví se jedná o to, že tam někdo ručně doplnil lidský překlad a Google tento automaticky nabízel. Naproti tomu nová formulace je už skutečný překlad a ten kupodivu vůbec není špatný (až na podivný cinkál). Je tam sice posun Když/Kdyby, ale přesto je ještě pochopitelný smysl sdělení, což s ohledem na to, že Bible není exaktní encyklopedický text, je solidní.

Koneckonců z jazykového pohledu je docela zajímavé se občas podívat, jak se s překladem právě Bible potýkají velmi odlišně různé překlady (navíc v různých dobách). Ta kniha je překládána stovky let, z tohoto pohledu je to úžasný doklad vývoje jazyka. A rozdíl je občas do očí bijící. Viz třeba zmíněný verš v Bibli Kralické (1613): Bych jazyky lidskými mluvil i andělskými, a lásky kdybych neměl, učiněn jsem měď zvučící aneb zvonec znějící. V angličtině je mezi různými historickými překlady rozdíl velmi podobný jako v češtině. A překládat něco z trochu archaičtější angličtiny může být pro automatické překladače pořádný oříšek ještě dost dlouho (chybí dostatečná zásoba textů, na kterých se lze učit).

+2/0
10.5.2017 17:14
Foto

P67a47v89e80l 37K46a91s34í36k25, 15T59e45c52h83n54e52t89.50c18z

Samozřejmě, proto není článek jen výčtem hodnocení, ale jsou tam ty ukázky (plus PDF ke stažení), aby bylo zřejmé, v čem jsou silné a slabé stránky překladu, což není jednoduché kvantifikovat. Jinak Bible - právě proto, že je velmi pečlivě přeložena snad do všech světových jazyků - je jedním ze zdrojů podkladů pro statistický překladač, a nyní i pro neuronové sítě. Je to taková novodobá Rosettská deska, spolu například s dokumenty OSN. Takže starší verze překladače byla tak přesná i proto, že Bible v různých jazycích je jeden ze zdrojů těch dat, na kterých Google Translate už dlouhodobě staví.

+1/0
10.5.2017 20:39

M69i33r56e35k 52G56a22j66e82r 5941126609800

Novy prekladac je dobry, ale nemuze byt lepsi nez priklady, ze kterych se uci. Dovedu si predstavit, ze treba "rich odour of roses" nebude skoro nikde prelozeno spravne nebo je sprvnych prikladu malo. Podle me je to "silna vune ruzi". (Diakritiku si doplnte, namem ji tu.)

0/0
10.5.2017 17:07
Foto

J74i14ř28í 77D33v11o90ř40á51k 5705699290948

Samozřejmě to asi po dobu příštích několika desítek let nenahradí překladatele literatury (teda minimálně do doby, než stroje získají " cit " ), ale pro genaraci lidí, která se na škole učila s odporem ruštinu, je každé podobné zlepšení dobrou zprávou. Kupodivu i některá videa na " rouře " zvládají automatický překlad titulků . Třeba : https://www.youtube.com/watch?v=voNBzuI7IJ4.

+1/0
10.5.2017 17:06

J88a29r19o22s44l39a90v 52H81e25j89n77a 4247541519

Jenom jest míti obavy, že nový překladač pochytí něco z "češtiny" písálků iDnes nebo novostí Ústavu pro jazyk český.

+1/−1
10.5.2017 13:40

L89u73b55o49m11í41r 67K29a82m63e22n47s78k48ý 3490378673156

takže teď se už bude Google překladač sám učit a bude čím dál chytřejší?

0/0
10.5.2017 13:22
Foto

P42a44v76e37l 91Č51e29r45n89í95k 1898735350430

"sám" je nepřesné vyjádření.

On se samozřejmě bude učit sám, ale potřebuje zdroje, ze kterých se bude učit a jisté mantinely, které mu budou říkat, zda se učí dobře či špatně.

0/0
10.5.2017 17:17

L37u45b89o50m39í11r 10K22a35m17e71n43s94k88ý 3620848753816

tak zdrojů bude mít dostatek pokud bude používán a vzhledem k možnosti oprav a doporučení se najde i dost rádců. Pokud je to opravdu hluboká neuronová síť pak by nic víc neměl potřebovat.

0/0
10.5.2017 19:40

M55i11l85a61n 98V69o37l64e52k 5219663416849

Ano, umělá inteligence ale určité doby zjistí, že ji již lidé nemohou ničím obohatit a začne budoucnost určovat sama. Tedy tak vám to aspoň budou tvrdit.

0/−3
10.5.2017 18:49

M54i27r31o95s48l46a49v 24B42e97n70d10a 4803480388668

Zrovna včera jsem se pokoušel pomocí google překladače číst finský článek o nedělním zápasu s námi a co na mě vypadlo, bylo na a často za hranicí srozumitelnosti. A to bych řekl, že hokej není až tak složité téma.

+1/0
10.5.2017 12:05
Foto

P52a62v44e94l 13K21a35s72í98k79, 47T39e71c69h24n67e17t85.74c93z

Jak se to vezme. Hokej složité téma není, ale sportovní redaktor se pochopitelně snaží věty vyšperkovat, a používá tedy nestandardní obraty nebo metaforami. Tohle je z jednoho článku o hokeji na iDNES.cz: vyznamenal, prodloužil utrpení, zapsal, nabudil, promarnil, využil, manko, má na kontě, odložil.

Samozřejmě, kdyby ten text byl z tiskové agentury, tak s tím překladač problém nemá. Tam jsou obraty jako: zápas skončil za stavu, první gól dal, druhý gól dal, brankářem byl, byl vyloučen apod.

+7/0
10.5.2017 12:19

B58ř48e48t51i77s21l55a29v 47K33r42e26j74s30a 3564175557166

Všimněte si, že překlad Fin > Čj se děje stále ještě po slovech a je poměrně dost nesrozumitelný. Zkuste nastavit Fin > Aj a změní se na celé věty, které jsou podstatně smysluplnější.

Myslím si, že prostě nový translator nefunguje všude.

+1/0
10.5.2017 12:32

B21ř54e47t83i66s76l76a34v 56K35r22e94j15s32a 3984895247746

FIN > ČJ

Česká republika (TSEK. Česká republika), tj Českou republiku (TSEK. Česko), někdy také v České republice, je vnitrozemský stát ve střední Evropě. Sousedními zeměmijsou Německo, Rakousko, Slovensko a Polsko. Česká deset milionů obyvatel tvořídrtivá většina Čechů patří Slovany. Hlavní město země se nachází na řece Vltavě v Praze.

Česká republika se skládá z historických Čech, počet a ve Slezsku na jihu byla ve své historii, stejně jako součást habsburské monarchie v části 20. století Československa.V současné době patří Česká republika do Evropské unie a její cestovní pas bezSchengenského prostoru a NATO.

FIN > AJ + AJ > ČJ

Česká republika (Československo), Česká republika (Československo), někdy i Česká republika, je vnitrozemská země ve střední Evropě. Sousední státy jsou Německo, Rakousko, Slovensko a Polsko. Z deseti milionů obyvatel České republiky je velká většina Slovanů Češi. Hlavní město se nachází na řece Vltavě, v Praze.

V dějinách Čech, Määristä a jihovýchodní části Slezska je Česká republika součástí Habsburské říše a části Československa v 19. století. Dnes je Česká republika součástí Evropské unie a jejího schengenského prostoru bez pasů a NATO.

+2/0
10.5.2017 12:34

T51o88m75á64š 87T92a56t34í58č89e31k 5260622130228

Google i přes nasazení neuronových sítí pořád používá slovníky a databáze obsahující shodné texty v různých jazycích apod. Takže to má popis hokejového utkání těžší než třeba návod na mobil - články se nepřekládají jedna ku jedné, na rozdíl od návodů.

Jasně sepsané texty o technice, která je už alespoň pár měsíců běžná na trzích, mají v překladači velice dobré výsledky. Akorát teda se furt vyvíjí nový věci.

+1/0
10.5.2017 12:35
Foto

K68r11i18s27t80ý24n91a 26V64a25ň49k95o48v42á 3277510325413

Naučte se rozdíl mezi mě a mně a překladač si z vás nebude dělat kozy.

+3/−7
10.5.2017 11:11
Foto

P80a52v67e22l 64K30a87s92í44k60, 23T31e43c65h20n85e87t50.84c97z

V článku to vysvětluji: "Všimněte si překlepu v původní větě. Zachovali jsme jej z důvodu integrity testu, ve zdrojovém článku jsme ji ale již opravili. Na překlad neměl překlep vliv." A dále: "Mimochodem, chybu s „bratrovraždou“ již systém opravil..." Takže to shrnu ještě jednou: 1) Překlep "mně" místo "mne/mě" byl již v původním textu zdrojovém textu (brali jsme reálné texty, tedy včetně překlepů, chyb, neformálních výrazů apod.). 2) Nebylo by fér, abych v jedné verzi překladače předložil větu bez překlepu a jedné s překlepem, proto jsem překlep zachoval (v původním článku pana Pacnera jsem již ale překlep opravil). 3) Překladač v době testování přeložil stejně verzi s "mně" i "mě". 4) Nyní, dva týdny po testování, již Google opravil překlad, a to opět u obou verzí věty ("mně" i "mě").

Doufám, že je to nyní již jasné?

+6/0
10.5.2017 11:53
Foto

B97r19o35n49i79s26l54a75v 15G11a27b19r78y57š 2502489911

Ono je hlavne zakladem umet ten prekladac vubec pouzivat. Vim, ze je "hloupy", a proto tam nebudu psat slangove vyrazy a slozite vety. Vyraz "sto pade" bych tam urcite nenapsal. Jenze dost lidi neumi poradne cesky a nedokazou napsat vetu spravne tak, aby ta veta byla spravne prelozena.

0/−3
10.5.2017 11:05
Foto

P79a18v73e65l 66K91a57s59í54k38, 60T54e63c44h29n41e96t91.11c36z

Máte tedy pocit, že by překladač měl překládat jen spisovné věty, a kdykoli je v nich nespisovný výraz, tak má vyhodit chybu a říci "nespisovné výrazy nepřekládám"? To je přece nesmysl. A nejde o to, co byste "do překladače napsal", obvykle si překládáte něco, co napsal někdo jiný. Vždyť vy vlastně říkáte, že cizinec by neměl mít možnost dozvědět se, co znamená "sto pade" :-)

+4/0
10.5.2017 11:55
Foto

B22r46o58n28i70s83l64a12v 72G82a51b85r12y22š 2312839911

Ne, nemyslel jsem tím, že by to překladač neměl umožňovat. Je fajn, když si třeba najdu slangové výrazy v daném jazyce. Ale sám jistě dobře víte, že čím lepšími daty program nakrmíte, tím lepší máte výsledky. A tady je to podle mě stejný případ. Jenže řeč je pouze o angličtině, která je sama o sobě dost děsivá a chaotická.

Uvědomuju si jeho nedokonalost, a proto se v překladači raději vyjadřuju spisovně a v krátkých jednoduchých větách. Sám jsem měl s tímto přístupem problémy. Když jsem si nechal překládat teze disertační práce, použitím překladače bych ušetřil asi 6000 Kč. Problém byl v tom, že se vyjadřuju příliš složitě na to, aby to překladač pochopil. Bohužel se tohoto způsobu stále nemohu zbavit. Třeba si nemohl poradit s větou "Autor v problematice optimalizace linkového vedení v aglomeraci bude rovněž klást důraz na minimalizaci přestupních procesů za pomocí účelové funkce tak, aby byla zaručena jednoduchost a přehlednost celého systému v souvislosti s velikostí aglomerace.".

Zhruba před osmi lety jsem překládal titulky z angličtiny k jednomu filmu. Po částech jsem text kopíroval do překladače a ten měl odvahu překládat i citoslovce a jména. Např. citoslovce smíchu, které v anglických titulcích bylo napsáno jako "ha-ha" překladač přeložil jako "nízká zahradní zídka-nízká zahradní zídka". Ve filmu byla i postava jménem Rachel. Její překlad byl "světlehnědá barva".

Vůbec jsem nechtěl poukazovat na to, že by se do překladače měly psát jen spisové výrazy. Ale vzhledem k tomu, jak jsem už psal, že dost lidí neumí pořádně česky, nemůže od překladače na základě mizerných vstupů očekávat kvalitní výstupy. Ale předpokládám, že s dalším vývojem překladač chybu rozpozná a bude nějak tušit, co tím pisatel myslel.

0/−1
10.5.2017 13:25

J18o63s93e19f 16N73o51v25a39k 5708712946808

Ta vaše věta je nesrozumitelná i v češtině.

0/0
11.5.2017 6:40
Foto

B75r10o13n75i73s13l89a84v 24G45a75b22r66y69š 2932779761

Vědecká rada s ní problém neměla. Zkuste si ji rozpitvat.

0/0
11.5.2017 8:04







Najdete na iDNES.cz



mobilní verze
© 1999–2017 MAFRA, a. s., a dodavatelé Profimedia, Reuters, ČTK, AP. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s., zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s., se sídlem
Karla Engliše 519/11, 150 00 Praha 5, IČ: 45313351, zapsaná v obchodním rejstříku vedeném Městským soudem v Praze, oddíl B, vložka 1328. Vydavatelství MAFRA, a. s., je členem koncernu AGROFERT.