Britské listy


pondělí 4. června

O B S A H

Co je nového v České republice:

  • Komentovaný přehled zpráv Odkazy:
  • Výběr nejzajímavějších článků z poslední doby Společnost:
  • Proč už nemáme děti? (Observer) Fyzika:
  • Fyzikální zákony neznemožňují cestování časem (Vladimír Havlík) Městská policie v Brně porušovala zákon:
  • Městská policie protizákonně natáčela brněnskou street party (OPH) Amnesty International, Londýn, o brutalitě české policie a o zacházení s Romy:
  • Česká republika musí splnit své smluvní závazky, jinak to ohrozí její vstup do Evropské unie O češtině v počítači a na internetu:
  • Češi vzdychají a vymýšlejí si kódy Kamenických (Jiří Šoler) Dopis Štěpánu Kotrbovi:
  • "Peníze nesmrdí" - ubohá, podlá lež (Martin Šorm) K veřejnému vystupování novinářů:
  • Je páně Kubičkův slovník slovníkem Svobodné Evropy? (Vladimír Bernard, Radko Kubičko) Česká politika:
  • Kacířské představy o potřebě a podobě reformy politického systému (Martin Stín) Polemika:
  • Mladé frontě Dnes: Není pravda, že si v ČR nemohou cizinci kupovat půdu (Jiřina Fuchsová) Polemika:
  • Dogmatismus Jany Dědečkové (Radek Batelka) Microsoft a ti druzí:
  • Podnět ÚOOÚ: Stránka www.zatepla.cz porušuje zákon (Tomáš Pecina)



    Ikona pro Vaši stránku...

    |- Ascii 7Bit -|- PC Latin 2 -|- ISO Latin 2 -|- CP 1250 -|- Mac -|- Kameničtí -|


  • O češtině na internetu

    Češi vzdychají a vymýšlejí si kódy Kamenických

    Jiří Šoler

    Vazeny pane Hurychu,

    dovoluji si nekolik poznamek k Vasemu clanku v Britskych listech: Vrava je na míste, ale nejde vyvolavat umele.

    1) Nektere priciny uspechu anglictiny ve vypocetni technice jsou zcela prozaicky technickeho charakteru, k jejich pochopeni neni vubec zapotrebi jakykoliv lingvisticky, filosoficky ci ideologicky vyklad. Jednim z nich je jednoduchost grafické reprezentace textu - anglictina nepouziva krome apostrufu zadne exoticke znaky, zadna diakriticka znamenka, vystaci s holou latinskou abecedou, ktera je dosazitelna na kteremkoliv pocitaci.

    Dodnes snad jedinym problemem bylo pouziti dvou prevazujicich kodu: EBCDIC a ASCII (ten dnes prevazil) a na historickych pocitacich tiskarny bez malych pismen. Pri srovnani s problemy napr. cestiny, jejimu dvojimu kodovani na PC (v DOSu a ve Windows), nemluve o odlisnem mezinarodnim standardu ISO-8859-2 (uzivan v UNIXu) a o bici zvanem kod Kamenickych, ktery si na sebe upletli Cesi sami.

    Samozrejme, na mezinarodni urovni jsou dnes tyto problemy řešeny 16-bitovým kódem UNICODE a normou ISO 10646, jejich úsporne kodovani napr. normou RFC 2279 (UTF-8). Ovsem zatimco dnes napr. Japonci bezne komunikuji pomoci Internetu a elektronicke posty v narodnim jazyce a v narodni abecede, Cesi stale vzdychaji, vymysleji si kody Kamenickych, elektronicka posta je dodnes bezpecna jen v "telegrafni" cestine bez diakritiky.

    Kdyz jsem v  70-tych letech spravoval pocitacovou databazi s texty v plne cestine, byl jsem prirozene exot, ale kupodivu dodnes na mne podobne pohlizeji cesti "opravdovi programatori", kdyz pokladam za samozrejmost pracovat na pocitaci v plne cestine a s vyuzitim odpovidajicich grafickych nastroju. Krome toho Americane, kdyz vymysleli svuj telegraf (odtud pochazi kod ASCII), realizovali, na rozdil od Evropy, vetsi kulturu prenasene informace, proto napr. telegraf s takovym uspechem vytlacil Ponny Express, a ta kultura je dnes vyuzivana i v Internetu.

    2) Neohebnost slov v anglicke gramatice vyrazne zjednodusuje kontextove vyhledavani, hledani preklepu a gramatickych chyb. Zatimco ceske slovo musite pro jednoduchy hledac preklepu uvest ve vsech moznych gramatickych formach, v anglictine vystacite s jednim nebo nekolika malo tvary. Pri kontextovem vyhledavani v cestine musite zkusit ruzne varianty promenliveho kmene slova, v anglictine to plati jen pro nekolik nepravidelnych sloves.

    3) Zatimco nektere narody - napr. Cesi ci Nemci - si libuji na slozita gramaticka pravidla s jeste vetsi radou vyjimek, pravidla anglicke fonetiky i gramatiky jsou jednoducha: Kdyz nevis vyslovnost, podivej se do slovniku, na deleni slov je delici slovnik, ktery ma kazda pisarka v supliku (pokud neni soucasti editoru). Zatimco napr. Nemci pisi sva slozena slova dohromady, takze se v nich lze nekdy tezce orientovat, anglicane pisi mezi jednotliva slova mezery (a pokladaji je za adjektiva), coz zjednodusuje formalni interperetaci.

    4) Abecedni razeni anglictiny je prisne lexikograficke, chybi tam podobne perlicky jako "ch", respektovani ci ignorovani diakritickych znamenek apod. Tyto "malickosti" silne znevyhodnuji cestinu a u nekterych by stalo za to se zamyslet, zda jsou v jazyce nezbytne nebo jen zbytecnou prekazkou jejiho vyuzivani na pocitacich. Pokud si Nemci dovolili zasadni pravopisnou reformu, meli bychom se i my zamyslet, zda napriklad zvlastni razeni "ch" je tak nezbytne.

    Jednim z duvodu zavedeni zvlastniho razeni sprezek typu "ch" napr. do jazykove podpory ve Windows bylo nemecke "ostre S" razene jako "ss". Nemcu je mnoho, proto ztrata takoveho trhu je citelna. Mozna ze dnes, kdy Nemci tento exot zrusili, by se nikdo s takovou komplikaci neobtezoval.

    4) Prednost maji samozrejme hojne pouzivane jazyky - odladeni zvukoveho interpretu anglictiny prinasi mnoho zakazniku, zatimco interpret ceske vyslovnosti mnoho penez neprinese. Vetsina podpory narodnich jazyku vdeci za  svuj vznik Japoncum, Cinanum, Indum, jejichz trh je tak perspektivni, ze se tam kazdy snazi proniknout. Trh ovladany cestinou je maly, Slovaci maji jeste vetsi smulu.

    5) Pokud selze trh, musi si male narody pomoci s vlastni jazykovou kulturou sami. Zatimco napr. Japonci pokladaji praci v narodnim prostredi za  samozrejmost v plnem souladu s mezinarodnim spolecenstvim, Cesi si vymysli "kody Kamenickych" a jinych "narodnich specifik" podrezavaji vlastni vetev. I zde je na jedne strane pruznost, na druhe ucta k narodni tradici, potrebnou devizou. My ovsem, misto toho abychom resili zakladni problemy narodni a jazykove kultury, resime pseudoproblemy homosexualu a fetaku.

    Pamatuji se na jeden Invex, kde zahranicni firma vystavovala kopretinovou tiskarnu vcetne ovladace, ktery umoznoval soutiskem nekolika znaku tisknout i texty v nemcine. Protimni cesti odbornici zasli a tvrdili, ze v cestine by to asi neslo, zatimco pritomny expert behem veletrhu dokazal upravit ovladac i pro cestinu. Pravda, napr. pismeno s hackem se tisklo na  trikrat - pismeno, carka a obracena carka, ale pracovalo to. Osobne jsem si postupne doplnil DOSovy WordPerfect o cesky slovnik pro deleni a testovani pravopisu - vyzadovalo to asi rok sbirat nova slova a cas od casu je do slovniku doplnit - ale chodilo to, jini skeptici tvrdili, ze pro slozitou cestinu to neni mozne. Jak rikaji Anglicane, kde je vule, tam je i cesta.


    Poznámka TP: Češi jsou v tom, že existuje tolik kódování češtiny, nevinně. Jediným domácím kódem pro PC, který J. Šoler zmiňuje, je kódování MJK, neboli kód bratří Kamenických; ten se ale rozšířil před všemi ostatními systémy, a tak nelze jeho autory vinit z nerespektování standardů. Naopak, jejich volba pozic pro české znaky byla vhodnější, než první standard, s nímž přišel Microsoft, tj. kódová stránka Latin 2 (CP-852) - tam jsou znaky s diakritikou umístěny na pozicích semigrafiky a mnohé programy, pracující v tomto režimu, tak vypadají v "kamenících" lépe než v "latině".

    Ani další diskrepanci nezavinil nikdo z Čechů: Windows přišly se zcela novým kódováním češtiny (CP-1250), které se lišilo jako od MJK, tak od CP-852 a nerespektovalo dokonce ani už tehdy existující ISO normu 8859-2, běžnou na unixových systémech.

    Moderní Windows tak pracují dokonce se čtyřmi různými kódováními češtiny současně. Počítejte se mnou: v DOSovém okně nalezneme CP-852, ve Windows se texty ukládají volitelně v CP-1250 nebo v Unicode (UTF-8), webový prohlížeč a e-mail používají jako standard kód ISO-8859-2 a True Type fonty jsou pouze unicodové.

    Ano, je to nepředstavitelný chaos, ale určitě ho nezpůsobil nikdo z Čechů. Spíš bych hledal viníka západněji, v okolí Seattlu...


    Britské listy

    |- Ascii 7Bit -|- PC Latin 2 -|- ISO Latin 2 -|- CP 1250 -|- Mac -|- Kameničtí -|