Je-li transformovaný znak v tabulce kodu nastavené jako "Default Character Coding" - modře ,
není-li z oné tabulky - červeně (tedy tak by dopadl omikron při defaultně nastaveném Windows-1251).
P.S.
Jedině by se (vždy) modré ne-ASCII znaky objevily při defaultně nastaveném UTF-8. (Méně barevně zdatní jedinci by si tedy UTF-8 neměli nikdy nastavovat.)
Soustředím se na ten první a druhý nechám stranou.
Myšlenka:
Podezřelé jméno je takové, které používá podezřelý mix znaků z různých skupin.
Podrobněji:
Unicode je rozdělen do několika přesně daných skupin znaků – Basic Latin, Latin-1 Supplement, Latin Extended-A, ..., Cyrillic, ..., General Punctuation atd. Podezřelé je např. to, když se ve jméně domény vyskytují znaky ze skupin Basic Latin i Cyrillic. Ještě podezřelejší je, když se znaky z obou těchto skupin vyskytují v jednom slově.
Samozřejmě není nutné, aby byly znaky rozdělené do skupin stejně jako v Unicode, může se vymyslet či využít jiné rozdělení.
Mimochodem - kdyz mluvite o slovech (znaky z vice skupin v jednom slove) - mel jsme dojem, ze "slovo" je termin majici vyznam v kontextu konkretniho jazyka - pokod zname "jen" kodovani, ale nikoliv jazyk, nelze o slovech nijak jednoznacne mluvit. Nebo se mi snad lingviste budou za ten dojem smat ?
Nicmene, na vine neni IDN. Problem se zamenou domen "lide" a "l1de" pripadne "NOS" a "N0S" je, vcetne moznosti zameny jejich certifikatu vydanych tou nejduveryhodnejsi CA, je na existenci IDN nezavisly. IDN pouze zvysila riziko "vyuzitelnosti" tohoto jevu - ale problem sam je rozhodne starsi nez IDN - a je to problem obtizne resitelny. Pokousime se totiz program (browser) donutit, aby nam algoritmicky urcil, zda je konkretni spojeni pro nas bezpecne nebo nikoliv - a poskytujeme mu k tomu neuplne informace a nechceme se na jeho rozhodovani aktivne podilet. Pritom rizika, o kterych je rec, by vyrazne omezila uz takova drobnost, kdyby bez ohledu na vystavujici CA browser upozornil na prvni setkani s novym certifikatem a kdyby upozornil na to, ze "dnes" se konkretni cilovy server predstavil jinym certifikatem nez minule (znovu bez ohledu na to, kdo certifikaty podepsal). To by problem, samozrejme, neresilo bezezbytku, ale alespon by to umoznilo cloveku, aby odpovednost prevzal. Soucasne implementace browseru jsou, bohuzel, nejen nevhodne, ale ani neumozni cloveku, aby odpovednost za posuzovani prevzal.
IDN je v celem problemu jen "dalsi kapka" ...