Vlákno názorů k článku Jak funguje bayesovský antispamový filtr? (2.) od Kicko - Dost pouzivany Spam Assasin pouziva druhu metodu ......

  • Článek je starý, nové názory již nelze přidávat.
  • 11. 3. 2005 21:14

    Kicko (neregistrovaný)
    Dost pouzivany Spam Assasin pouziva druhu metodu ... teda prevedie "slovo" (skupinu znakov) na zakladny tvar a zaroven si zachova aj povodny tvar ... nemyslim si, ze by to bolo zle riesenie.
  • 12. 3. 2005 8:36

    Michal Kára (neregistrovaný)
    > Dost pouzivany Spam Assasin pouziva druhu metodu ...

    Myslite bayesovsky filtr obsazeny v SA? A zakladnim tvarem myslite prevedeni na mala pismena atp? To je mozne.

    Co se tyce vlastnosti: Ve vysledku muzete mit v hodnoceni dve informace se silnou korelaci (poruseni principu nezavislosti). Tipuji, ze ten zakladni tvar bude mit hodnoceni pomerne blizko k polovine, takze ve vetsine pripadu se do "uzsiho vyberu asi nedostane"... Navic pokud pocitate v mailu jako skutecnosti pouze vyskyty slov (coz SA dela), tak to asi prilis nevadi. Mozna v nekterych pripadech to muze mit nizsi ucinnost/jistotu (ten zakladni tvar bude hodnoceni tahnout ke stredu). Ale zas to bude mit kratsi dobu uceni.

    Takze muj teoreticky zaver je, ze to neni vylozene spatne (zvlast vzhledem k hodnoticimu systemu SA - viz predchozi dil), ani (zrejme) nijak genialni. Realne vlastnosti by se museli overit experimentalne.
  • 15. 3. 2005 15:53

    Nobody (neregistrovaný)
    "... teda prevedie "slovo" (skupinu znakov) na zakladny tvar ..."
    A toto je právě "sgallovština". Nikdo neví, co po překladu (z cizí literatury) asi tak může znamenat "zakladny tvar". To ale nevadí, aby se to nedalo diplomantům programovat. (Natož aby je to naprogramovat někdo naučil. Hlavně, když se do diplomky opíše neimlementovaná teorie, protože se stejně muselo udělat plno zanedbání. Vždyť na to v životě nikdo nepřijde.)
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).