<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:media="http://search.yahoo.com/mrss/">
<channel>
<image>
<link>https://lupa-martin.imho.cz/</link>
<title>Lupa.cz</title>
<url>https://lupa-martin.imho.cz/img/rss-88x31.gif</url>
<width>88</width>
<height>31</height>
</image>
<title>Lupa.cz - články a aktuality autora Karel Pánek</title>
<link>https://lupa-martin.imho.cz/autori/karel-panek/</link>
<description>Lupa.cz - server o českém Internetu</description>
<language>cs</language>
<pubDate>Wed, 22 May 2002 04:25:00 GMT</pubDate>
<item>
<title>Jak vypadá Google uvnitř?</title>
<link>https://lupa-martin.imho.cz/clanky/jak-vypada-google-uvnitr/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>V dnešním díle navážeme na slib z dílů předchozích a představíme profesionální stroj tak, jak vypadá uvnitř a jak je vlastně naprogramován. Z důvodů momentální atraktivity a popularity to nebude nikdo jiný než Google.</description>

<author>redakce@lupa.cz (Lupa.cz: Karel Pánek)</author>
<pubDate>Wed, 22 May 2002 04:25:00 GMT</pubDate>
<enclosure url="https://i.imho.cz/images/534/ilustracni-obrazek.jpg" length='25876' type="image/jpeg"/>
<guid isPermaLink="false">lupa-martin.imho.cz-text-6277</guid>


</item>
<item>
<title>Jehla v kupce sena: fulltextový stroj na 72 řádcích</title>
<link>https://lupa-martin.imho.cz/clanky/jehla-v-kupce-sena-fulltextovy-stroj-na-72-radcich/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>V dnešním pokračování odbouráme poslední mýty o tom, jak jsou fulltexty komplikované. Uvedeme kompletní zdrojové texty stroje, který napíšeme přímo ve skriptovacím jazyce a to vše na 72 řádcích. Tento fulltext můžeme rychlostí i kvalitou odpovědí řadit někam mezi Kompas (dlouhá léta využívaný na Seznam.cz) a Webfast (Centrum.cz).</description>

<author>redakce@lupa.cz (Lupa.cz: Karel Pánek)</author>
<pubDate>Wed, 24 Apr 2002 04:20:00 GMT</pubDate>
<enclosure url="https://i.imho.cz/images/534/ilustracni-obrazek.jpg" length='25876' type="image/jpeg"/>
<guid isPermaLink="false">lupa-martin.imho.cz-text-6223</guid>


</item>
<item>
<title>Jehla v kupce sena: Sběr zpětné vazby</title>
<link>https://lupa-martin.imho.cz/clanky/jehla-v-kupce-sena-sber-zpetne-vazby/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>V předcházejících dílech našeho seriálu, které se ještě zabývaly recenzemi českých vyhledávacích strojů, jsme se zmiňovali o jejich možných nedostatcích a následně představili nejeden model, jenž může napomoci zkvalitnění samotného procesu vyhledávání. Dnes se zastavíme u techniky sběru zpětné vazby.</description>

<author>redakce@lupa.cz (Lupa.cz: Karel Pánek)</author>
<pubDate>Wed, 17 Apr 2002 04:20:00 GMT</pubDate>
<enclosure url="https://i.imho.cz/images/534/ilustracni-obrazek.jpg" length='25876' type="image/jpeg"/>
<guid isPermaLink="false">lupa-martin.imho.cz-text-6208</guid>


</item>
<item>
<title>Jehla v kupce sena: Thesaurus</title>
<link>https://lupa-martin.imho.cz/clanky/jehla-v-kupce-sena-thesaurus/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>V minulých dílech jsme na Lupě psali o situacích, kdy vyhledávač musí překonat problém tzv. máloslovných dotazů, které jsou do něj vkládány. Z těch je totiž  velice obtížné zjistit, na co se uživatel vlastně ptá. V tomto článku si popíšeme jednu ze základních technik, jak si stroj může dotaz upravit a &quot;domyslet&quot;.</description>

<author>redakce@lupa.cz (Lupa.cz: Karel Pánek)</author>
<pubDate>Wed, 10 Apr 2002 04:20:00 GMT</pubDate>
<enclosure url="https://i.imho.cz/images/534/ilustracni-obrazek.jpg" length='25876' type="image/jpeg"/>
<guid isPermaLink="false">lupa-martin.imho.cz-text-6194</guid>


</item>
<item>
<title>Šrotujeme text</title>
<link>https://lupa-martin.imho.cz/clanky/srotujeme-text/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>Dosud jsme se zabývali pouze vlastní indexací textů. Ty jsme chápali jako dokumenty obsahující určitý počet rozdílných termů. Ovšem způsoby, jak si tyto termy vyrobit, jsou značně komplikované, přestože by se mohlo zdát, že jde o nejjednodušší fázi celé operace zvané fulltextové vyhledávání. Není tomu tak.</description>

<author>redakce@lupa.cz (Lupa.cz: Karel Pánek)</author>
<pubDate>Wed, 03 Apr 2002 04:25:00 GMT</pubDate>
<enclosure url="https://i.imho.cz/images/534/ilustracni-obrazek.jpg" length='25876' type="image/jpeg"/>
<guid isPermaLink="false">lupa-martin.imho.cz-text-6180</guid>


</item>
<item>
<title>Jehla v kupce sena: ASPSeek</title>
<link>https://lupa-martin.imho.cz/clanky/jehla-v-kupce-sena-aspseek/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>ASPSeek patří do kategorie fulltextových strojů s ukládáním dat do SQL databáze. V současné době je využíván na serveru WebSeek.cz, kde zajišťuje vyhledávací služby v doméně .cz. Jedná se o nejlepší bezplatný stroj s implementací P-rank a vah nad termy. Ani tento server však nevydržel jednoduché dotazy a složil se.</description>

<author>redakce@lupa.cz (Lupa.cz: Karel Pánek)</author>
<pubDate>Wed, 06 Mar 2002 04:20:00 GMT</pubDate>
<enclosure url="https://i.imho.cz/images/534/ilustracni-obrazek.jpg" length='25876' type="image/jpeg"/>
<guid isPermaLink="false">lupa-martin.imho.cz-text-6130</guid>


</item>
<item>
<title>Jehla v kupce sena: MnogoSearch</title>
<link>https://lupa-martin.imho.cz/clanky/jehla-v-kupce-sena-mnogosearch/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>Vyhledávací stroj s SQL back-endem pod drobnohledem. Je každý volně šiřitelný software nevhodně implementovaný aneb co oči nevidí, srdce nepálí? Jak realizovat DoS proti tomuto stroji? Pro zkoumání všech rysů jsme využívali MnogoSearch, který obsahuje mnoho zajímavých vlastností jako indexování pomocí HTTP, HTTPS apod.</description>

<author>redakce@lupa.cz (Lupa.cz: Karel Pánek)</author>
<pubDate>Wed, 20 Feb 2002 04:25:00 GMT</pubDate>
<enclosure url="https://i.imho.cz/images/534/ilustracni-obrazek.jpg" length='25876' type="image/jpeg"/>
<guid isPermaLink="false">lupa-martin.imho.cz-text-6097</guid>


</item>
<item>
<title>Jehla v kupce sena: rozšířený boolský model</title>
<link>https://lupa-martin.imho.cz/clanky/jehla-v-kupce-sena-rozsireny-boolsky-model/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>Tato poslední kapitole věnované teoretickému pozadí vyhledávacích strojů se zabývá rozšířeným boolským modelem (RBM). Mezi jeho reprezentanty, avšak s částečně atypickou implementací, můžeme počítat takové stroje, jako je např. WebFast nebo různé vyhledávače s databázovým základem (například via SQL).</description>

<author>redakce@lupa.cz (Lupa.cz: Karel Pánek)</author>
<pubDate>Wed, 13 Feb 2002 04:25:00 GMT</pubDate>
<enclosure url="https://i.imho.cz/images/534/ilustracni-obrazek.jpg" length='25876' type="image/jpeg"/>
<guid isPermaLink="false">lupa-martin.imho.cz-text-6082</guid>


</item>
<item>
<title>Architektury a modely webových strojů</title>
<link>https://lupa-martin.imho.cz/clanky/architektury-a-modely-webovych-stroju/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>Také vás někdy zajímalo, jaké nástroje používají pro práci s velkými objemy informací v CIA nebo NASA? V dnešním pokračování se podíváme blíže na strukturu webových vyhledávačů a představíme i stroj těmito agenturami používaný. Zároveň s tím popíšeme některé základní modely, na kterých fulltextové stroje pracují.</description>

<author>redakce@lupa.cz (Lupa.cz: Karel Pánek)</author>
<pubDate>Wed, 06 Feb 2002 04:20:00 GMT</pubDate>
<enclosure url="https://i.imho.cz/images/534/ilustracni-obrazek.jpg" length='25876' type="image/jpeg"/>
<guid isPermaLink="false">lupa-martin.imho.cz-text-6066</guid>


</item>
<item>
<title>Jak pracuje metavyhledávač?</title>
<link>https://lupa-martin.imho.cz/clanky/jak-pracuje-metavyhledavac/?utm_source=rss&amp;utm_medium=text&amp;utm_campaign=rss</link>
<description>Jak pracuje metavyhledávač? Co je to metaindex? V minulé kapitole jsme si již představili metavyhledávače a myšlenku, která za nimi stojí. Prezentovali jsme i dva základní problémy spojené s těmito typy strojů. Prvním z nich je metodika přepočítaní parciálních vah, druhým tzv. selekční problém.</description>

<author>redakce@lupa.cz (Lupa.cz: Karel Pánek)</author>
<pubDate>Wed, 30 Jan 2002 04:25:00 GMT</pubDate>
<enclosure url="https://i.imho.cz/images/534/ilustracni-obrazek.jpg" length='25876' type="image/jpeg"/>
<guid isPermaLink="false">lupa-martin.imho.cz-text-6051</guid>


</item>
</channel>
</rss>