Nedavno jsem se snazil najit praci pres ruzne personalni servery a prohledavace a nahodou jsem objevil odkaz na http://www.eprofil.cz kde je super odkazovnik na vsechny mozne IT firmy, trochu sice nemotorne roztridene, avsak prohlizeni je konfortni a velmi rychle. Doporucuji. Lada Koubek
Nalezení informace zadáním jednoho či dvou klíčových slov není hudbou vzdálené budoucnosti, ale vzdalující se minulosti, protože stránek, kde ta slova jsou, přibývá obrovskou rychlostí. Odpověď na specifičtější dotazy lze dnes získat jen fulltextovým vyhledavačem s booleanským hledáním.
Rozumět přirozenému jazyku potřebuje uživatel - dvě klíčová slova nejsou přirozený jazyk, ale dokumenty, které uživatel hledá, většinou v přirozeném jazyce jsou.
Nevěřím,že internet někdy odstraní nutnost používat vlastní hlavu - stejně jako při hledání v knihovně najdete specifičtější informace jenom, když už o tématu něco víte a během hledání využíváte zjištěné informace k tomu, abyste hledal cíleněji.
Jenom je mi záhadou, proč je snažší najít tu správnou stránku v angličtině pomocí třeba Altavista-advanced search nebo Infoseek Advanced Search, než v češtině pomocí Kompas-pokročilé vyhledávání: nenajde stránky, o kterých vím, že existují. Anglicky psaných stránek je přitom o mnoho řádů víc.
Nevěřím, že někdy bude existovat mašina, která bude odpovídat na základní lidskou potřebu :"Nevím, co chci, ale nedám pokoj, dokud to nedostanu".
V podstate souhlasim, take jsem uz zvazoval, zda odstupnovani bodu 3,2,1 je nejlepsi (prvni ma trojnasobek oproti patemu odkazu), nejspis to pri samotnem testu jeste poupravime smerem k mensi "prisnosti" ohodnoceni.
Delal jsem uz nejake predbezne testy (samotny test pro Lupu budou delat pokud mozno jini lide, ja bych nemusel byt povazovan za nestranneho) a "tve" Centrum si vede velmi slusne (coz jsem necekal ;-) ) - a po dukladnejsi analyze jsem dospel k necemu, co souvisi s tvym komentarem - Centrum velmi casto vrati pozadovanou stranku, ale ne vzdy na prvnim miste - oproti tomu Google ji vrati take a to presne na prvnim miste.
Myslim ze moderni vyhledavace uz se idealu (aspon takovemu, jaky budeme hodnotit) docela blizi. Co se telepatie tyce, Google 1.4.2000 vydal specialni utilitku (tzv. mentalplex)- animaci spiralovite se svijejiciho terce -> kdyz uzivatel usilovne mysli na to, co chce vyhledat a klikne na tercik, Google vrati patricny vysledek!
Clanek se mi velice libi, jen s jednou veci nesouhlasim: To,
zda se hledana stranka objevi jako prvni nebo jako ctvrta, je vetsine uzivatelu uprimne jedno, zejmena je-li z popisky ve vystupu vyhledavace snadno poznatelne, ze je to prave tato stranka. A tak bude popisovany system bodovani mit relevanci k realite (tj. pocitum uzivatele) neprijemne malou, ponevadz se podstatne rozdily (tj. zda se hledana stranka objevila na prvni strance vystupu ci nikoliv) utopi v sumu generovanem nepodstatnymi rozdily mezi prvnimi nekolika pozicemi. Lepsi by bylo, kdyby byly body ze zacatku vice mene konstantni a pote prudce klesaly k nule.
Z jineho soudku: Nalezeneim informaci na Internetu zadanim jednoho ci dvou klicovych slov (snad s vyjimkou hledani produktu ci firmy nejakeho konkretniho jmena) bude jeste dlouho hudbou vzdalene budoucnosti, jelikoz by v lepsim pripade od vyhledavacu vyzadovalo porozumeni prirozenemu jazyku (hle, opet Chomsky), v horsim pak telepaticke spojeni s uzivatelem, aby pochopily to, co se z textu dotazu ani vycist neda. A tak je pri soucasnem stavu techniky vice mene nutnosti, aby se nejen vyhledavace ucily nove triky, ale take aby se uzivatele snazili "te neme tvari trosku pomoci", to znamena neformulovat dotazy naprosto bezmyslenkovite a namisto toho se pokusit byt trochu vystiznejsi a treba uvest hned nekolik slov souvisejicich s tematem a pripadne je i nejak ohodnotit. A proto by vyhledavacove testy mely obsahovat i takoveto "sofistikovanejsi" dotazy, nejen "humpolactinu".
Je pravda, že Google je celou svou technickou koncepcí a samozřejmě hlavně výsledky naprosto někde jinde, vysoká relevance, rychlost... Myslím, že tímhle směrem (třeba v kombinaci s klasickými seznamovými službami) by se měly vyhledavače ubírat...
To je hledani tak na minutu. Treba do Google dotaz 'battery mignon diameter' a hned prvni vysledek (nemyslim ten placeny odkaz) je pertinentni (pokud tedy rovnou nepotrebujete vykres a staci vnejsi rozmery). Avsak treba na teto strance muze byt chyba, tezko soudit o duveryhodnosti tohoto zdroje. Tedy nejlepsi a nejpresnejsi by byly stranky vyrobce s prislusnymi vykresy.
Myslim, ze klicem k uspechu je tam to slovo "diameter" a vedet, ze tuzkova baterie se prezdiva jako "mignon". U vyhledavac Fast je pertinentni hned druhy odkaz, ktery uvadi rozmery baterii Varta a je tam odchylka 0,5mm oproti prvnimu zdroji. Varta me tedy inspirovala zkusit Googlem (prohledava i PDF, kde bude vyssi pravdepodobnost obsahu duveryhodnych informaci) dotaz "battery mignon diameter General Power" (GP povazuji za jednu z nejvetsich firem v prislusnem oboru) hned na druhem miste PDF http://extranet.varta.com/pdf-catalog/PH_6_00.pdf
s peknymi tabulkami. Dalsi kroky by mohly nasledovat k vyhledani prislusne normy IEC (International Electrotechnical Comission), nevim presne, jak je to v zahranici, ale napr. u nas se normy nesmeji zverejnovat, kopirovat ani pujcovat (natoz davat na web) a jedina schudna cesta k jejich opatreni je si je koupit.
>>> příspjevek mimo mísu <<<
V týhle <ekonomika.idnes.cz/ekonomika.asp?r=ekonomika&c=A010228_212249_ekonomika_was&l=1&t=A010228_212249_ekonomika_was&r2=ekonomika> TZ iDnes, pojednávající o klikni.idnes.cz, se mimo jiné píše:
"Regionální začlenění záznamů v katalogu umožňuje uživatelům vyhledávat záznamy pouze ve zvoleném regionu a omezit tak výsledky hledání. Tato služba je zatím na českém trhu jediná"
Je to hezký a pomáhá to, akorát že kecaj... musim se zastat serveru www.vokno.cz, sice nestojí za nic, ale rozhodně je na českém trhu a byl i před nějakým klikni.idnes....to se přece nedělá...kdyby aspoň napsali, že je služba třeba nejlepší, ale jediná. LŽOU LIDEM do VOČÍ (vočima na to koukám na netu :-))
btw to asi znamená, že MAFRA centrum.cz nepotřebuje...
>>> konec příspjefku mimo mísu <<<
U "vystižení tématu" navrhuju testnout užitečnost nejen prvních X, ale i dalších Y odkazů. Nebo přidat trestné body za úplné úlety. Myslím, že by to usnadnilo volbu čísel X/Y a líp odměnilo relevanci.
Google mam rad, nejvic jsem zvykly na altavistu. Kdyz ale posledni dobou neco potrebuju, tak jsem opakovane uspel lepe na yahoo. Obcas testuju atlas, seznam a redbox na fulltext vetsinou v ceskem jazyce. Kdyz jsem hledal neco, o cem pisou noviny a casopisy, tak jsem casto nasel nejvice na atlasu. Pak jsem treba zkousel vzit nahodne kousky textu ze sve osobni stranky (ktera je v katalogu atlasu i redboxu), a tady zase nasel skoro vsechno redbox, atlas obcas.
Nevim, nakolik je to racionalni, ale seznam mam rad na katalog, ale fulltext je mi nejak uzivatelsky neprijemny a malokdy tam neco najdu.
hmmm jeste me napada jeden: http://ftpsearch.ntnu.no
idealni v pripade hledani software
a pak klasicky http://hack.box.sk
taky na hledani software (ale trosku jinak ;-)
Zminujete Google a Megatext. Oba maji sve vyhody i nevyhody - Google ma skvelou relevanci, Megatext ne. Megatext ma vetsi a nejspis i aktualnejsi databazi stranek v .cz, Google zase umi najit ceske stranky i jinde (ale zase si je plete se slovenskymi, jugoslavskymi a polskymi). Google neumi moc operatoru, Megatext zadne. A k tomu mame jeste dalsich minimalne 10 vyhledavacu. Je to tedy slozite tema a tento clanek se pokousi najit zpusob, jak mu porozumet.
Jan Zacek o neco vyse rika: "Přesné cílení a vystižení tématu je velmi významný přístupový rozdíl a tento článek to uživatelům jenom zase znepřehlední" - vzdyt souhlasim - take si myslim, ze je to vyznamny pristupovy rozdil a PRAVE PROTO jsem to rozdelit na dva ruzne testy. Tedy se vyhybam te chybe, kterou mi vytykate... ne?
Obecne x odborne terminy: pokusime se o co nejsirsi zaber ruznych dotazu; rozliseni je totiz jeste slozitejsi (reallife x internetove informace, zabava x prace, muzi x zeny, casto kladene x obskurni dotazy, atd.)
Dale tvrdite (stale pan Zacek), ze "na obecne dotazy, vystizeni tematu jsou nejlepsi katalogy" - ja si myslim, ze toto je predsudek - zminovany Google si dobre poradi s obojim. Ale i toto je vec, ktera nas pri testu bude zajimat.
Zajimavym tematem k diskusi by mozna taky bylo, zda hledajici ve skutecnosti vedi co hledaji. Mnohem tezsi je totiz mozna si uvedomit, co hledam a jak to definovat.
Najit firmu XY zase neni tak tezke, ale co kdyz chci napriklad najit informaci o tom, jak rozmery maji tuzkove baterie. - tuhle informaci jsem pred casem hledal a nenasel, ackoli jsem pomerne zkusenym 'hledacem' v internetu. Jinak souhlasim s nekterymi diskutujicimi, ze Google povazuji za soucasny nejlepsi indexovy search engine.
Zcela přesně. Navíc když po Google chci české stránky, tak mi vrátí všechny stránky psané česky, zatímco "české" fulltexty mi vrací pouze ty z TLD cz, což nemá smysl.
Nedavno jsem objevil Megatext (www.megatext.cz). Na cesky fulltext dle meho mineni nejlepsi vyhledavac. Je silene rychly, indexuje jen ceske stranky a bere v uvahu i ruzne pady. Google je dobry pro celosvetovy web, ale pokud chci jen ceske zdroje, tak Megatext je fakt super.
...je asi jasnou pravdou, že podle druhu hledání používám vyhledávač. Jestli potřebuji přesně jedno slovo (sousloví), přesné cílení, je ideální fulltext, ale na obecné dotazy, vystižení tématu, jsou nejlepší katalogy a ten má Seznam největší v Čechách.
Přesné cílení a vystižení tématu je velmi významný přístupový rozdíl a tento článek to uživatelům jenom zase znepřehlední. Hledání na Internetu je obsahem 6 hodinového školení, nedá se obsáhnout v jednom článku.
Mluvíme - li tedy o metodice testování, je třeba rozlišovat ještě typ dotazu. Rozdíl je i mezi obecnými a odbornými dotazy.
Dostatečně relevantní testování musí každý uživatel sám na svých hledaných pojmech, nedá se to zobecnit. Tím ale nezrazuji od popisu jednotlivých vyhledávacích technologií, může to být zajímavý výlet za oponu. Ale poslední díl zavání neobjektivitou, oceněný server toho může využít v konkurenčním boji a možná i neoprávněně.
...zvlaste od te doby, kdy zacal indexovat i dokumenty ve formatu PDF. Co clovek pri vhodne polozenem dotazu nenajde na prvnich trech strankach vypisu, to na internetu s vysokou pravdepodobnosti neni.
Naprosty souhlas. Google je vynikajici, navic indexuje i stranky s parametrem (nevim, jestli uz to zavedly i ostatni, ale od chvile, co jsem narazil na Google jsem na zadnem jinem vyhledavaci nebyl:)))