Vlákno názorů k článku Obávaný formát? PDF! od ad - Generuji pdf z dvi (dvipdfm) a na zaklade...

  • Článek je starý, nové názory již nelze přidávat.
  • 2. 11. 2005 9:55

    ad (neregistrovaný)
    Generuji pdf z dvi (dvipdfm) a na zaklade tohoto clanku jsem v nem zkusil hledat s diakritikou. Nefunguje např. č,ž. Problém je asi v tom, že TeX používá (pokud se mu neřekne jinak) své vlastní fonty a ty jsou obsaženy v pdf dokumentu. Ty mohou mít různé kódování. Při zobrazení a tisku je to jendo (a pro tento účel pdf generujeme), při vyhledávání nebo kopírování přes schránku to vadí. Vypadá to, že zde není definovaná převodová tabulka mezi kodváním dokumetu a kódováním výstupu (Acrpbat Reader 6.0 Windows). To může být chyba návrhu formátu pdf (nepočítá, že kódování textu může být jiné než kódování vyhledáváných řetězců), chyba generátoru pdf (neuvádí kódování správně) nebo chyba prohlížečky pdf (neumí tuto informaci správně zpracovat).
  • 2. 11. 2005 21:36

    Michal Metlička (neregistrovaný)
    Tohle není pravda. PDF standardně podporuje prakticky libovolné kódování. Hlavní podmínkou je to, aby použitý font měl správně pojmenovány jednotlivé glyfy. Potom není problém vyhledávat v pdf vytvořeném na libovolné platformě, kopírovat z něj text nebo v něm vyhledávat. Častým problémem výstupů Texu je to, že akcentované znaky jsou vytvořené složením samostatného akcentu a neakcenotvaného znaku. To je po zkopírování nebo při vyhledávání interpretováno jako dva znaky.

    Michal Metlička
    Adobe Systems

    PS: Nejrychlejším způsobem, jak zjistit, jestli je pdf korektně vytvořeno je zkopírovat část textu s českými znaky do schránky a vložit je třeba do notepadu. Pokud je text převeden správně bylo pdf vytvořeno korektně.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).