Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Diskuse k článku

„Málem jsem zabil bratra!“ Nový překladač je lepší, chyby jsou vtipnější

Jak si neuronové sítě Překladače Google poradí s češtinou? Otestovali jsme překladač na 135 větách a srovnali novou verzi se starou. Na první pohled je patrné nejen výrazné zlepšení, ale i zásadní změna způsobu, jak systém využívá neuronové sítě k překladu celých vět. Ve specifických situacích se ovšem ještě má co učit.

Upozornění

Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.

Zobrazit příspěvky: Všechny podle vláken Všechny podle času

L82u47k27á36š 83K19r61á68l 8698701397450

Staron's system :D

0/0
24.5.2017 15:30

V60á51c64l20a68v 17Š23u95b96r55t 9597483228457

Stále to ze všeho nejvíc připomíná legendárního Maďara v trafice od Pythonů:-)

0/0
14.5.2017 14:27

P69e80t65e77r 90M13l91i41c26h 8294442753435

Preklad prislovi je spravny, kdyz o prelozi doslovne. To jen ucitelky anglictiny nabyvaji dojemm, ze ma pouzit jednu z ceskych variant.

Predstavte si film, nejakou situaci, na kterou aplikuji osoby prislovi. Vy, kdyz pouzijete jine prislovi, tak nedava smysl pro danou situaci a neni vubec vtipne. A pritom vsichni ve filmu se osobe, co to anglicke prislovi rekla, zmeji, jako nejvtipnejsi poznamce na svete.

0/−1
13.5.2017 11:00
Foto

P22a83v73e24l 16K23a54s78í24k40, 33T54e25c80h81n22e36t86.77c24z

Není jeden správný způsob, jak přeložit takovou frázi. Musí se to dělat v kontextu.

0/0
16.5.2017 10:53

K47a48t80e13r90i78n36a 53M28a35t44t74h92e72w10s 3214324415531

Ten dotaznik pod clankem take, zda se, prosel prekladacem a vypada to na tu starsi verzi.

0/0
12.5.2017 18:51
Foto

P35a66v65e54l 49K42a33s75í32k19, 29T89e41c66h60n94e72t13.70c32z

Ano, prošel překladačem, a dokonce tou novou verzí. Šlo o ukázku toho, jak je si překladač poradí s běžnými i nezvyklými termíny. (Naivně jsem si myslel, že ten záměr byl zcela zřejmý.)

0/0
13.5.2017 8:37

J10o59s88e94f 57K60r51o79u69p88a 7941438515577

S umělou inteligencí mají lidi velké zkušenosti z úřadů.

0/0
12.5.2017 13:50

H80a92n40a 69P67r13o14k43o98p44o13v18á 8419770363181

Uf, z ruštiny колокольный звон (kolokol'nyj zvon) - což by mělo být asi zvonění zvonu - překládá do češtiny jako mýto, do polštiny myto, do němčiny Maut... přitom do angličtiny jako bell ringing... :-/

0/0
12.5.2017 0:49

H61o18n26z49a 65P16a65n54s83k71ý 3333512490390

Když už jsme u těch hříček s jazykem. Někde jsem četl souhrn asi 30 věcí, které byly pojmenovány ve stylu vysílačky (walkie talkie). Třeba potřesení rukou na schůzce bylo meetie greetie.

https://www.google.cz/amp/thechive.com/2015/11/26/if-the-guy-who-named-walkie-talkies-named-other-items-24-photos/amp/

0/0
11.5.2017 17:21
Foto

M93a97r24t13a 24D78o72u10b63r33a81v65o60v53á 4910484285737

Sorry jako, ale nejdřív musíte umět česky, aby se zobrazil správný překlad.

Příklad číslo 8 - máte místo "mě" slovo "mně", což úplně obrací smysl.

Když jsem do překladače zadala větu ve správném znění:

"Když odcházeli, málem mě, bratra a babičku zabili, protože domky v naší vesnici zapálili," vzpomínal po letech.

tak byla přeložena takto:

"When they left, they almost killed me and my brother and grandmother because they lit our houses in our village," he recalled for years.

0/0
11.5.2017 16:50
Foto

M52a61r37t85a 27D12o90u74b37r84a84v95o78v61á 4930694495157

aha, nevšimla jsem si, že už se tu o tom mluvilo. takže nic, jako bych nic nepsala.

+3/0
11.5.2017 16:54

M38i62r56e45k 61G53a91j66e98r 5541216619450

Dobre je videt, na jake urovni je ten novy jazykovy prekladac na prekladu tech 4 moznosti v ankete. Zbytecne jsem ucil cizi jazyky. Ostatne, co cekat, kdyz me za jejich vyuku nikdo neplatil.

0/0
11.5.2017 0:26

T52o59m 98S87t12r18a79k22o21š 7480517862248

Jestli Vám vyšlo to co mě, tak je to velmi kvalitní překlad. Manželka se ještě teď celá svíji v záchvatu smíchu.

0/0
10.5.2017 23:28

I67v54a29n71a 90N13o86v54a89k20o94v26a 2752412349442

zajimave, zkousela jsem kousek normalniho holandkeho txstu do cestiny. Preklad nedaval vubec smysl. To same pres anglictinu a vysledek perfektni.

0/0
10.5.2017 22:10
Foto

V91ě30r25a 32R49a52m29b62o16u66s41k34o80v26á 3245151570467

Ta vaše "vtipná" chyba tam byla, protože jste to měli špatně česky. Teď už IU zřejmě pochopila...

0/0
10.5.2017 21:47
Foto

P85a47v47e36l 63K18a74s90í61k48, 13T71e36c75h54n76e29t28.35c63z

Ta chyba v překladu tam byla bez ohledu na mně/mne. Stejně jako teď už tam není, bez ohledu na mně/mne. A chci taky připomenout, že to byla podstata testu: otestovat překladač v reálných podmínkách, na reálných textech.

0/0
10.5.2017 21:56

M73i24r35e66k 65G33a70j61e72r 5731956899670

Jestli ten prekladac vetsinou neni schopen rozlisit mně/mě, tak to bude hodne prakladu spatne. Doufejme jen, ze ten prekladac nebudou pouzivat vlady svetovych velmoci pri mezistatnich vyjednavanich. Mohlo by totiz brzo dojit ke sevetove valce.

0/0
11.5.2017 0:29
Foto

P38a55v86e96l 64K65a17s57í58k89, 79T58e43c40h64n79e13t96.94c79z

Nejde o to, že to neumí rozlišit, jde o to, že bere v potaz kontext věty.

0/0
11.5.2017 14:52

P93e71t70r22a 79K70o39v46á22ř27o87v52á 2230131971300

Díky za precizní článek. R^

+4/0
10.5.2017 21:40
Foto

K67a79r64e61l 27J15í25r33a 6544177311926

Zkuste si přeložit větu: Osuš si šosy. Anglický překlad Googlem zpětně přeložený do češtiny je opravdovou perlou...

+3/0
10.5.2017 21:35

T16o81m 68S75t10r19a72k65o83š 7730267932368

Jestli Vám vyšlo to co mě, tak je to velmi kvalitní překlad. Manželka se ještě teď celá svíjí smíchem.

0/0
10.5.2017 23:29

J70o44s41e11f 37K45a40r42f44í21k 7332425436610

Jo jo, hovíkno to překládá pořád;-D

0/0
11.5.2017 8:00

P87a56v46e66l 72S48t46a40v40j57a22n51í13k 6408415457921

Na "Dry your shit" mi nepřijde nic tak divného :-)

0/0
11.5.2017 0:57

D62u69š35a55n 70M83i32c27h71a90l60i70č70k45a 5439661569834

Tiež som sa riadne zarehlil..... R^

0/0
11.5.2017 20:25

F19i46l17i53p 54T88ř40e14b82a 6883840418986

Největší pokrok překladače Googlu bude, až se odkaz na něj vrátí na stránku s výsledky vyhledávání.

+2/0
10.5.2017 20:21
Foto

P10a97v27e69l 71K17a16s27í71k24, 48T10e57c85h68n69e22t77.84c55z

Nevím, jak to přesně myslíte, každopádně když vyhledáváte něco na Google, tak vedle výsledků, které jsou v jazyce, kterým nevládnete, je odkaz "Translate this page". Což je možná to, co chcete.

0/0
10.5.2017 20:41

T45o25m66á10š 42T42i39c90h59ý 3725527745712

Výborný článek!

Možná trpím profesionální deformací botanika:překvapuje mě, že překladač z kontextu zahrady nezvládl přeložit správně šeřík a hloh a místo plácá blbosti o barvě a trnu.

0/0
10.5.2017 20:07
Foto

P58a50v66e46l 31K67a52s96í13k71, 44T70e21c98h84n53e77t98.41c60z

Díky. Ano, ten kontext předchozí (statistická) verze překladače zvládala jen u sousloví, ale zvládla jej i tam, kde si nová verze (zatím) neporadí.

0/0
10.5.2017 20:54

W55a70l89t60e70r 81D16i70v65i35š 6957262462162

Zaujalo mne to hodnocení u překladu citace z Bible (list Korintským). V prvním případě vůbec nejde o skutečný počítačový překlad, je to téměř doslovně opsaný verš z ekumenického překladu Bible (Kdybych mluvil jazyky lidskými i andělskými, ale lásku bych neměl, jsem jenom dunící kov a zvučící zvon.). Řekl bych tedy, že stejně jako u přísloví se jedná o to, že tam někdo ručně doplnil lidský překlad a Google tento automaticky nabízel. Naproti tomu nová formulace je už skutečný překlad a ten kupodivu vůbec není špatný (až na podivný cinkál). Je tam sice posun Když/Kdyby, ale přesto je ještě pochopitelný smysl sdělení, což s ohledem na to, že Bible není exaktní encyklopedický text, je solidní.

Koneckonců z jazykového pohledu je docela zajímavé se občas podívat, jak se s překladem právě Bible potýkají velmi odlišně různé překlady (navíc v různých dobách). Ta kniha je překládána stovky let, z tohoto pohledu je to úžasný doklad vývoje jazyka. A rozdíl je občas do očí bijící. Viz třeba zmíněný verš v Bibli Kralické (1613): Bych jazyky lidskými mluvil i andělskými, a lásky kdybych neměl, učiněn jsem měď zvučící aneb zvonec znějící. V angličtině je mezi různými historickými překlady rozdíl velmi podobný jako v češtině. A překládat něco z trochu archaičtější angličtiny může být pro automatické překladače pořádný oříšek ještě dost dlouho (chybí dostatečná zásoba textů, na kterých se lze učit).

+2/0
10.5.2017 17:14
Foto

P36a15v87e84l 76K28a65s28í42k53, 32T39e30c43h54n46e80t72.20c24z

Samozřejmě, proto není článek jen výčtem hodnocení, ale jsou tam ty ukázky (plus PDF ke stažení), aby bylo zřejmé, v čem jsou silné a slabé stránky překladu, což není jednoduché kvantifikovat. Jinak Bible - právě proto, že je velmi pečlivě přeložena snad do všech světových jazyků - je jedním ze zdrojů podkladů pro statistický překladač, a nyní i pro neuronové sítě. Je to taková novodobá Rosettská deska, spolu například s dokumenty OSN. Takže starší verze překladače byla tak přesná i proto, že Bible v různých jazycích je jeden ze zdrojů těch dat, na kterých Google Translate už dlouhodobě staví.

+1/0
10.5.2017 20:39

M25i86r59e16k 74G49a60j81e41r 5761746279340

Novy prekladac je dobry, ale nemuze byt lepsi nez priklady, ze kterych se uci. Dovedu si predstavit, ze treba "rich odour of roses" nebude skoro nikde prelozeno spravne nebo je sprvnych prikladu malo. Podle me je to "silna vune ruzi". (Diakritiku si doplnte, namem ji tu.)

0/0
10.5.2017 17:07
Foto

J15i72ř79í 65D91v32o22ř94á37k 5385469370418

Samozřejmě to asi po dobu příštích několika desítek let nenahradí překladatele literatury (teda minimálně do doby, než stroje získají " cit " ), ale pro genaraci lidí, která se na škole učila s odporem ruštinu, je každé podobné zlepšení dobrou zprávou. Kupodivu i některá videa na " rouře " zvládají automatický překlad titulků . Třeba : https://www.youtube.com/watch?v=voNBzuI7IJ4.

+1/0
10.5.2017 17:06

J60a72r26o28s54l32a15v 31H89e48j54n80a 4207361669

Jenom jest míti obavy, že nový překladač pochytí něco z "češtiny" písálků iDnes nebo novostí Ústavu pro jazyk český.

+1/−1
10.5.2017 13:40

L83u86b64o77m14í15r 25K69a73m80e88n50s97k29ý 3860588233776

takže teď se už bude Google překladač sám učit a bude čím dál chytřejší?

0/0
10.5.2017 13:22
Foto

P43a87v87e65l 22Č32e52r21n12í24k 1348355830810

"sám" je nepřesné vyjádření.

On se samozřejmě bude učit sám, ale potřebuje zdroje, ze kterých se bude učit a jisté mantinely, které mu budou říkat, zda se učí dobře či špatně.

0/0
10.5.2017 17:17

L94u54b20o50m73í68r 32K36a45m12e51n46s64k81ý 3170128123886

tak zdrojů bude mít dostatek pokud bude používán a vzhledem k možnosti oprav a doporučení se najde i dost rádců. Pokud je to opravdu hluboká neuronová síť pak by nic víc neměl potřebovat.

0/0
10.5.2017 19:40

M40i12l75a48n 78V28o73l41e35k 5929133106459

Ano, umělá inteligence ale určité doby zjistí, že ji již lidé nemohou ničím obohatit a začne budoucnost určovat sama. Tedy tak vám to aspoň budou tvrdit.

0/−3
10.5.2017 18:49

M48i96r16o55s52l18a46v 83B54e54n17d52a 4853230748668

Zrovna včera jsem se pokoušel pomocí google překladače číst finský článek o nedělním zápasu s námi a co na mě vypadlo, bylo na a často za hranicí srozumitelnosti. A to bych řekl, že hokej není až tak složité téma.

+1/0
10.5.2017 12:05
Foto

P70a13v98e22l 44K93a80s16í56k75, 91T76e41c42h39n32e44t65.13c49z

Jak se to vezme. Hokej složité téma není, ale sportovní redaktor se pochopitelně snaží věty vyšperkovat, a používá tedy nestandardní obraty nebo metaforami. Tohle je z jednoho článku o hokeji na iDNES.cz: vyznamenal, prodloužil utrpení, zapsal, nabudil, promarnil, využil, manko, má na kontě, odložil.

Samozřejmě, kdyby ten text byl z tiskové agentury, tak s tím překladač problém nemá. Tam jsou obraty jako: zápas skončil za stavu, první gól dal, druhý gól dal, brankářem byl, byl vyloučen apod.

+7/0
10.5.2017 12:19

B58ř35e64t93i65s15l85a57v 68K94r91e14j97s73a 3644895137876

Všimněte si, že překlad Fin > Čj se děje stále ještě po slovech a je poměrně dost nesrozumitelný. Zkuste nastavit Fin > Aj a změní se na celé věty, které jsou podstatně smysluplnější.

Myslím si, že prostě nový translator nefunguje všude.

+1/0
10.5.2017 12:32

B11ř53e25t10i97s75l25a69v 52K21r25e83j18s30a 3194355187446

FIN > ČJ

Česká republika (TSEK. Česká republika), tj Českou republiku (TSEK. Česko), někdy také v České republice, je vnitrozemský stát ve střední Evropě. Sousedními zeměmijsou Německo, Rakousko, Slovensko a Polsko. Česká deset milionů obyvatel tvořídrtivá většina Čechů patří Slovany. Hlavní město země se nachází na řece Vltavě v Praze.

Česká republika se skládá z historických Čech, počet a ve Slezsku na jihu byla ve své historii, stejně jako součást habsburské monarchie v části 20. století Československa.V současné době patří Česká republika do Evropské unie a její cestovní pas bezSchengenského prostoru a NATO.

FIN > AJ + AJ > ČJ

Česká republika (Československo), Česká republika (Československo), někdy i Česká republika, je vnitrozemská země ve střední Evropě. Sousední státy jsou Německo, Rakousko, Slovensko a Polsko. Z deseti milionů obyvatel České republiky je velká většina Slovanů Češi. Hlavní město se nachází na řece Vltavě, v Praze.

V dějinách Čech, Määristä a jihovýchodní části Slezska je Česká republika součástí Habsburské říše a části Československa v 19. století. Dnes je Česká republika součástí Evropské unie a jejího schengenského prostoru bez pasů a NATO.

+2/0
10.5.2017 12:34

T47o15m56á39š 17T33a47t61í83č86e77k 5660772480298

Google i přes nasazení neuronových sítí pořád používá slovníky a databáze obsahující shodné texty v různých jazycích apod. Takže to má popis hokejového utkání těžší než třeba návod na mobil - články se nepřekládají jedna ku jedné, na rozdíl od návodů.

Jasně sepsané texty o technice, která je už alespoň pár měsíců běžná na trzích, mají v překladači velice dobré výsledky. Akorát teda se furt vyvíjí nový věci.

+1/0
10.5.2017 12:35
Foto

K55r63i58s34t57ý36n87a 77V95a61ň74k41o83v85á 3717940725653

Naučte se rozdíl mezi mě a mně a překladač si z vás nebude dělat kozy.

+3/−7
10.5.2017 11:11
Foto

P30a51v97e41l 71K45a90s62í46k91, 37T90e84c42h76n64e61t66.59c11z

V článku to vysvětluji: "Všimněte si překlepu v původní větě. Zachovali jsme jej z důvodu integrity testu, ve zdrojovém článku jsme ji ale již opravili. Na překlad neměl překlep vliv." A dále: "Mimochodem, chybu s „bratrovraždou“ již systém opravil..." Takže to shrnu ještě jednou: 1) Překlep "mně" místo "mne/mě" byl již v původním textu zdrojovém textu (brali jsme reálné texty, tedy včetně překlepů, chyb, neformálních výrazů apod.). 2) Nebylo by fér, abych v jedné verzi překladače předložil větu bez překlepu a jedné s překlepem, proto jsem překlep zachoval (v původním článku pana Pacnera jsem již ale překlep opravil). 3) Překladač v době testování přeložil stejně verzi s "mně" i "mě". 4) Nyní, dva týdny po testování, již Google opravil překlad, a to opět u obou verzí věty ("mně" i "mě").

Doufám, že je to nyní již jasné?

+6/0
10.5.2017 11:53
Foto

B17r59o36n60i76s42l91a62v 74G22a91b15r11y57š 2962309241

Ono je hlavne zakladem umet ten prekladac vubec pouzivat. Vim, ze je "hloupy", a proto tam nebudu psat slangove vyrazy a slozite vety. Vyraz "sto pade" bych tam urcite nenapsal. Jenze dost lidi neumi poradne cesky a nedokazou napsat vetu spravne tak, aby ta veta byla spravne prelozena.

0/−3
10.5.2017 11:05
Foto

P90a22v42e94l 88K95a49s14í76k41, 64T29e34c14h44n70e15t22.91c71z

Máte tedy pocit, že by překladač měl překládat jen spisovné věty, a kdykoli je v nich nespisovný výraz, tak má vyhodit chybu a říci "nespisovné výrazy nepřekládám"? To je přece nesmysl. A nejde o to, co byste "do překladače napsal", obvykle si překládáte něco, co napsal někdo jiný. Vždyť vy vlastně říkáte, že cizinec by neměl mít možnost dozvědět se, co znamená "sto pade" :-)

+4/0
10.5.2017 11:55
Foto

B79r94o13n98i98s71l78a45v 84G82a84b78r43y46š 2742479671

Ne, nemyslel jsem tím, že by to překladač neměl umožňovat. Je fajn, když si třeba najdu slangové výrazy v daném jazyce. Ale sám jistě dobře víte, že čím lepšími daty program nakrmíte, tím lepší máte výsledky. A tady je to podle mě stejný případ. Jenže řeč je pouze o angličtině, která je sama o sobě dost děsivá a chaotická.

Uvědomuju si jeho nedokonalost, a proto se v překladači raději vyjadřuju spisovně a v krátkých jednoduchých větách. Sám jsem měl s tímto přístupem problémy. Když jsem si nechal překládat teze disertační práce, použitím překladače bych ušetřil asi 6000 Kč. Problém byl v tom, že se vyjadřuju příliš složitě na to, aby to překladač pochopil. Bohužel se tohoto způsobu stále nemohu zbavit. Třeba si nemohl poradit s větou "Autor v problematice optimalizace linkového vedení v aglomeraci bude rovněž klást důraz na minimalizaci přestupních procesů za pomocí účelové funkce tak, aby byla zaručena jednoduchost a přehlednost celého systému v souvislosti s velikostí aglomerace.".

Zhruba před osmi lety jsem překládal titulky z angličtiny k jednomu filmu. Po částech jsem text kopíroval do překladače a ten měl odvahu překládat i citoslovce a jména. Např. citoslovce smíchu, které v anglických titulcích bylo napsáno jako "ha-ha" překladač přeložil jako "nízká zahradní zídka-nízká zahradní zídka". Ve filmu byla i postava jménem Rachel. Její překlad byl "světlehnědá barva".

Vůbec jsem nechtěl poukazovat na to, že by se do překladače měly psát jen spisové výrazy. Ale vzhledem k tomu, jak jsem už psal, že dost lidí neumí pořádně česky, nemůže od překladače na základě mizerných vstupů očekávat kvalitní výstupy. Ale předpokládám, že s dalším vývojem překladač chybu rozpozná a bude nějak tušit, co tím pisatel myslel.

0/−1
10.5.2017 13:25

J42o94s27e27f 14N29o92v56a84k 5858862386968

Ta vaše věta je nesrozumitelná i v češtině.

0/0
11.5.2017 6:40
Foto

B13r49o93n39i84s34l94a12v 72G65a31b71r86y50š 2862499731

Vědecká rada s ní problém neměla. Zkuste si ji rozpitvat.

0/0
11.5.2017 8:04







Najdete na iDNES.cz