Z principu věci tyto nástroje nikdy nemůžou na 100% fungovat. PDF prostě popisuje stránku na příliš nízké úrovni. Jak již bylo řečeno, PDF je zkrátka pro výměnu dokumentů, které už se nemají dále měnit, jenom prohlížet a tisknout.
To nemůže zaručit ale ani .doc, který také strukturu dokumentu popisuje víceméně na úrovní velikosti a řezu písma (styly jsou vlastně jen prostředek jejich definice). Pokud jste někdy zkoušel zautomatizovat zpracování .doc, jistě víte o čem je řeč. Cestu poskytují jedině standardní formáty postavené na XML jako ODF nebo Docbook, eventuelně pro jednodušší případy vystačíte i s TeXem. Ale .doc je jen o chloupek menší tragédie jako pdf a díky své rozšířenosti je to věc, která nejvíce brzdí inovace a automatizaci v kancelářském sektoru. Co musíte z pdf opsat, to musíte z .docu copypastovat - moc velký pokrok v tom nevidím. Je to jako náhrada srpu kosou v době kombajnů.
Nevidite velky rozdil mezi copypastovanim a opsanim?
Uz jste nekdy slepemu (ktery se ale jako slepy nenarodil, takze vi, co znamena videt) vysvetloval, ze jedno zdrave oko by stejne nebyl velky pokrok, protoze by nevidel stereo?
Pokud jste to zatim nevysvetloval, tak to ani nedelejte, protoze oni to "vidi" jinak :-).