Napisane przez: futrzak | 23 listopada 2018

„Kreatywne” podejście do organizowania pracy…

Do tej pory wydawało mi się, że tzw. „kreatywne” podejście do organizacji pracy (czytaj: agile plus wszystkim zarządzają ludzie po MBA, nie mający poza excelem pojęcia o niczym) zapanowało tylko w branży software developmentu.

O jakże wielką optymistką byłam! Okazuje się, że „optymalizacja kosztów”, „automatyzacja” i podobne dotarły też do branży tłumaczeń. Jak donosi znajoma, która na tłumaczeniach (wszelakich) zęby zjadła:

To jest daleka pochodna ogólnej tendencji do dzielenia pracy na jak najprostsze i najtańsze odcinki, wydatnie wspomaganego technologią.

W branży tłumaczeń jest tak samo. 20 lat temu przytomny, ogarnięty i obeznany Project Manager był wartością samą w sobie. Był też jakiś kult jakości u źródła, w sensie, istniała świadomość, że jak się zj*ie na początku, to potem się poprawi, ALBO NIE, więc najlepiej byłoby jednak nie zj*ać. Proces był też zasadniczo dwuetapowy, tłumaczenie + korekta, przy czym zakładało się, że prawidłowa korekta to nie jest przeróbka wszystkiego na nowo, tylko kontrola + poprawienie drobiazgów.

Obecnie idealny proces tłumaczenia wg branży wygląda tak, że mamy PM trzeciej klasy jakości, bo nie musi on nic umieć poza skonfigurowaniem projektu w sofcie, tłumacza wybranego metodą rozesłania z automatu zapytań do tysięcy osób (i kto pierwszy ten lepszy albo kryterium najniższej stawki), weryfikatora najczęściej nie ma, jest bezpłatny stażysta, który zrobi QA automatem, a często nawet nie zna języka źródłowego i/lub docelowego, do tego mamy niekonserwowane pamięci (czyli recyklowany od lat szajs i standardowe niesprawdzanie 100% trafień) oraz tłumaczenie maszynowe, które w parze ENG-PL niekoniecznie jest coś warte (ale pozwala płacić mniej tłumaczowi), więc statystyczne tłumaczenie to dziś najczęściej jakiś potwór Frankensteina ulepiony z gówna i śliny – ale znaczenie tłumacza udało się znacząco zmniejszyć, sukces.

Jak to wygląda na przykładach?

Tytułem wstępu trzy słowa o tym, jak działają narzędzia CAT (Computer Aided Translation): cokolwiek tłumaczysz, jest zapisywane w postaci par dwujęzycznych:
This is a cat.
To jest kot.

Ten materiał ląduje w bazie, zwanej pamięcią, i jest potem wykorzystywany. Jeśli narzędzie CAT napotka potem w nowym tekście „This is a cat.”, to poinformuje, że to tłumaczenie już ma i je podstawi. Jeśli znajdzie „This is a dog.”, to poinformuje, że ma coś podobnego różniącego się jednym słowem (to są tzw. fuzzies). Można też używać konkordancji: wyszukujesz wszystkie segementy ze słowem „cat” i patrzysz, jak zostało przetłumaczone.
Mamy więc tłumaczenie dużego systemu i jego kolejnych aktualizacji, robione jest to wszystko od lat, wszystkie tłumaczenia (w postaci takich par, jak opisane wyżej) lądują w tej pamięci.

No i mamy jakąś aktualizację drobną, powiedzmy, 5 tysięcy słów.

Dotąd było tak, że tłumacz dostawał całą tę pamięć wraz z materiałem do tłumaczenia. Poza tym, że rzeczy już przetłumaczone wskakiwały mu podczas pracy, mógł se to przeszukiwać – nieoceniona pomoc dla terminologii, kontekstu, czego tam jeszcze.

Aż jakieś zjeby gdzieś na drugim końcu wymyśliły, że chwila, moment, nie może być tak, że dajemy tłumaczowi całą tę bazę! Te miliony słów! Jeszcze to sprzeda na czarnym rynku, wykorzysta w innych zleceniach (teoretycznie nie może, podpisuje się odpowiednie kwity, ktoś może próbować, ale nikt o zdrowych zmysłach też nie będzie wsadzał dużych segmentów identycznych z cudzej pamięci).

Co się więc robi? Pretranslację, czyli zapuszcza się wsadowo tę bazę na tekście do tłumaczenia i wsadza się do pliku dwujęzycznego z tekstem do tłumaczenia te segmenty, które są w bazie. Czyli jak mamy „This is a cat.”, to wstawi „To jest kot”. To pół biedy, to jest tzw. 100% trafienie (identyczne), gorzej, że wsadzi też fuzzies, owszem, zaznaczając z boku, że to fuzzies, ale bez całej pamięci i bez możliwości porównania nie napisze, czym się różnią, tzn. przy „This is a dog.” podstawi „To jest kot.”, ale różnicę już musisz znaleźć i zmienić ręcznie.

Jest to w ch*j niewygodne i utrudniające pracę. Fuzzies generalnie są problematyczne i łatwo coś w nich przeoczyć nawet jak masz bazę i masz napisane, czym się różnią (bo zdania mogą być długie, tych różnic może być wiele w jednym segmencie itp.), a jak musisz to robić ręcznie, to już w ogóle. Do tego brak możliwości wyszukiwania terminologii – być może samo słowo „dog” już siedzi w tej bazie, bo ktoś to kiedyś przetłumaczył, ale nie załapało się w żadnym wstawionym elemencie, więc nie masz do tego dostępu.

Obecnie praktyka „nie dać tłumaczowi całej bazy, tylko pretranslować i niech się męczy z fuzzies” jest powszechna.
Dodaj do tego, że często nie wiesz, co tłumaczysz, bo te aktualizacje lądują u różnych tłumaczy, poszczególne opcje nie mają sensownych opisów (w ogóle żadnych, przeważnie jest to seria tekstów skopiowana do Excela), a jak się uprzesz i wyślesz zapytania, to w 90% przypadków nie dostaniesz żadnej odpowiedzi.

Kolejny paskudny aspekt tego, co się dzieje z branżą – znów wracamy do zasady działania CAT-ów. Za trafienia z pamięci oczywiście nie dostaje się pełnej stawki.

Obowiązuje tzw. siatka podstawień – czyli jeśli np. tłumacz ma sprawdzać 100% trafienia, to dostaje za te segmenty 20% stawki (jak nie ma sprawdzać, to nic), za fuzzies coś koło 50% (są różne przedziały procentowe zbieżności, inaczej się liczy zbieżne w 99%, a inaczej 75%, poniżej 75% zasadniczo to nie ma sensu, liczy się jak nowe, czyli bez trafień z pamięci).
Czyli jak masz 5000 słów, 4000 nowe, 1000 – 100% trafienia, to dostaniesz 4000 x 100% stawki + 1000 x 20%. Zakłada się bowiem, że to, co jest w pamięci, jest dobre jakościowo – zostało jakoś kiedyś przez kogoś sprawdzone.

W praktyce jest to gówno prawda. Można oberwać pamięcią, w której nic się nie nadaje do wykorzystania, bo jest po prostu zła po całości, tłumaczył kretyn na zmywaku po roku kursów wieczorowych angielskiego. Tłumaczenia mogą też być teoretycznie prawidłowe, ale nie w tym kontekście i tak trzeba coś poprawiać (bo np. trafiły tam segmenty po różnych tłumaczach, z których jeden pisał „wkręć śrubę”, a drugi „wkręcić śrubę”. Może być jakiś odziedziczony materiał sprzed wprowadzenia glosariusza – w pewnym momencie klient skodyfikował pewne terminy, a w pamięci siedzą stare tłumaczenia, których nikt nie poprawił, i w momencie, jak trafiają do dokumentu, należy to poprawić zgodnie z glosariuszem. Mogą też być tłumaczenia, które nie pasują w kontekście, np. tabelka z nazwami kolorów i różnymi pozycjami w nagłówku (Dress: Blue, Trousers: Blue – z pamięci podstawi się wszędzie „niebieska”, bo pierwsze wystąpienie będzie takie, w językach fleksyjnych to mocno daje się we znaki, wszelkie tłumaczenia „it coś tam coś tam” itp.).

Generalnie: PRAWIE NIGDY nie ma tak, żeby nie trzeba było absolutnie nic zmieniać w odziedziczonym materiale.

20 lat temu istniał konsensus: dobra, korzystamy z takiej technologii, i czasem się udaje, a czasem nie, i to nie tłumacz ma ponosić konsekwencje tego, że się nie udało. I jak coś nie grało, to nie było żadnej dyskusji: wydłuża się termin, płaci pełną stawkę za wszystko, mówi „trudno” i kasuje za to klienta jak za nowe tłumaczenie w całości, po czym żyje się dalej.

Obecnie już tego nie ma i podejścia są dwa.

1. Tłumacz ma to poprawić wszystko za darmo. Tzn. pamięć jest do dupy, masz do przetłumaczenia 5000 słów za połowę stawki (bo tak wyszło z siatki podstawień), masz w praktyce 2 x tyle roboty, ale zleceniodawca domaga się, że masz to zrobić w pierwotnie uzgodnionej cenie i w tym terminie „bo na pewno nie jest aż tak znowu źle”. Jak domagasz się więcej kasy i wydłużenia terminu, jesteś traktowana jak kosmita. Marudzenie, przeciąganie sprawy, domaganie się kolejnych uzasadnień z nadzieją, że się zmęczysz i odpuścisz. Jedyna metoda to słowne pierdolnięcie pięścią w stół „pamięć jest do dupy, albo płacicie 100%, albo nie robię, proszę o decyzję w ciągu godziny” (ale oczywiście o coś takiego się obrażają i uważają to za straszne faux pas).

2. Zleceniodawca ma to w dupie. Informujesz, że w pamięci jest chujnia, zleceniodawca mówi, że masz zmieniać tylko co, do Ciebie należy, resztę zostawić jak jest. Teoretycznie uczciwe, ale:
– Z tego wychodzą właśnie wspomniane potwory Frankensteina, czyli masz tekst posklejany z twórczości 5 tłumaczy, raz „wkręć śrubę”, raz „wkręcić śrubę”, zdanie „Łuparkę przechowywać w miejscu niedostępnym dla dzieci” w instrukcji suszarki do włosów (bo ktoś kiedyś tak przetłumaczył, zupełnie legitnie, słowo „device” w instrukcji łuparki), a 100% trafień mamy nie sprawdzać, rajt?
– Jak będzie reklamacja, to i tak Ty oberwiesz (udowadniaj potem tygodniami, co z tego zlepieńca gównianego jest Twoje, a co nie jest Twoje).

Czy ktoś jeszcze się dziwi, że lokalizacje softu przypominają potwory? To dlatego nie uzywam zadnego softu w wersji polskojęzycznej – po prostu najcześciej niewiele z niej rozumiem, albo też dostaję napadów histerycznego śmiechu…

Reklamy

Responses

  1. Kiedyś czytałem na jakiejś stronie internetowej tłumaczenie na polski angielskiego tekstu o zjeździe gnieźnieńskim. Otóż z Bolesławem Chrobrym spotkał się Olejek Ja Ja Ja ( Otto III ) . Wcale się nie dziwię, że nie czytasz żadnych automatycznych tłumaczeń na polski. Niekiedy wychodzą po prostu jaja. Do profesjonalnych celów to się całkiem nie nadaje. Choć ja np. bardzo sobie cenię „googla translate” , dzięki któremu mogę przeczytac teksty w nieznanych mi językach. Sam pracowałem jako tłumacz, jeszcze przed epoką internetu i była to męczarnia, zwłaszcza w przypadku bardzo specjalistycznych terminów, które nie występowały w słownikach. A dzisiaj? Przełączam wikipedię na dany język i tłumaczenie słowa mam jak na dłoni.
    Sam czasem zlecam tłumaczenia, głównie instrukcji, na nietypowe języki i
    nie widzę problemu zapłaty stawek, jakie sobie biuro tłumaczeń życzy.
    Nie są to aż wygórowane koszty, jak się powszechnie myśli.

  2. Wcale się nie dziwię, że nie czytasz żadnych automatycznych tłumaczeń na polski

    Ale w opisie z notki to tlumaczą ludzie. CAT to nie jest „automatyczne tlumaczenie”.

    Google translate jest dobry w zakresie językow, w ktorych bylo duzo tekstow zrodlowych – np. wrzucano dyrektywy i inne dokumenty UE (ktore oryginalnie przez ludzi byly tlumaczone). I w oficjalnym jezyku, biznesowym, naukowym, tlumaczenia ang-niem, ang-hiszp, ang-francuski są bardzo dobre.

    A weź sobie wrzuć w google translate i spróbuj przetlumaczyc na polski taką frazę hiszpańską, która jest slyszana na ulicach Argentyny wszędzie:
    „che boludo!” i dupa :)

    Albo, przetlumacz za pomoca GT na polski: „Don’t give me a cold shoulder you douchebag”. Bedzie zabawnie :)

  3. @ZQW

    Ale tu nie ma ani słowa o automatycznym tłumaczeniu – cała notka jest o tym, jak świetna technologia, która w założeniu miała pomóc tłumaczom całkowicie białkowym w uzyskaniu lepszej jakości (dzięki CAT-om nie robi się po raz dziesiąty tego samego, zachowanie spójności terminologicznej jest łatwiejsze), w gruncie rzeczy służy głównie bogaceniu się pośredników i powoduje pogorszenie jakości, przy przerzuceniu całego ciężaru korzystania z nich na najsłabsze, ostatnie ogniwo.

    Korzystając z biur tłumaczeń musisz zdawać sobie sprawę z tego, że ten tłumacz na samym końcu, który to robi, dostaje z tego bardzo niewiele i coraz mniej. W USA typowa stawka dla klienta końcowego to 20 centów za słowo, potem tłumaczenie przechodzi przez łańcuszek pośredników, z których większość jest doskonale zbędna (typowo wygląda tak: duża globalna firma tłumaczeniowa -> duża firma tłumaczeniowa w kraju języka docelowego -> mniejsze biuro -> tłumacz), aż tych 20 centów amerykańskich zostaje 12 groszy polskich.

    Musisz także zdawać sobie sprawę z tego, że wiele biur oszukuje i sprzedaje Ci coś, czego tak naprawdę nie dostarcza, bo zapewnia, że dostaniesz tłumaczenie + co najmniej 1 weryfikację żywym człowiekiem. W praktyce w licznych przypadkach dostaniesz tłumaczenie zrobione najtańszym tłumaczem, jakiemu udało się to wcisnąć oraz „weryfikację” odpowiednim softem (żaden żywy człowiek tego tego nie przeczytał w całości). Spadające stawki powodują odpływ sensownych tłumaczy z biur i przestawianie się na klientów końcowych, więc jakość tego, co biuro dostaje na wejściu, także spada.

    Oczywiście, istnieją przypadki, kiedy trzeba korzystać z biur (bardzo duże projekty realizowane przez wielu tłumaczy równocześnie z koniecznością koordynacji/zapewnienia spójności, tłumaczenia na wiele języków, projekty wymagające skomplikowanej technicznie konwersji materiału do tłumaczenia i/lub przetłumaczonego), ale tak normalnie będziesz mieć taniej i lepiej, jak znajdziesz tłumacza pracującego w parze z weryfikatorem, czyli oferującego tłumaczenie z weryfikacją przez „drugą parę oczu”.

  4. „Spirit is strong but the flesh is weak” -> „wódka jest mocna ale mięso zepsute”. Moje ulubione!

  5. „…że tzw. „kreatywne” podejście do organizacji pracy …zapanowało tylko w branży software developmentu…” – u mnie to działa od kilku lat. Jakieś 4-5 lat temu na spotkaniach były opowiadane takie brednie, że się w pale nie mieści. Były kwestionowane oczywiste oczywistości i szły zarządzenia typu „proszę Wisłę zawrócić kijem”. Dziś przyszło nieco opamiętania.
    Ale tylko nieco. I to tylko dlatego, że na pewne sektory firmy po prostu została położona gruba laga – tam nikt nic nie zrobił przez kilka lat i teraz wychodzi, że pewne rzeczy WCALE nie były robione. A na to są już paragrafy. Całe szczęście … Witamy w polskiej korporzeczywistości :):):):)


Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj /  Zmień )

Zdjęcie na Google+

Komentujesz korzystając z konta Google+. Wyloguj /  Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj /  Zmień )

Zdjęcie na Facebooku

Komentujesz korzystając z konta Facebook. Wyloguj /  Zmień )

Connecting to %s

Kategorie

%d blogerów lubi to: