• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Proč Seznam dokázal vzdorovat Googlu?

Pavel Houser
18. 8. 2012
| Články

Fulltextové vyhledávání je celá věda. Jak se dnes liší přístup obou hlavních hráčů na českém trhu? Seznam v roce 1996 začínal jako katalog a i když později přidal fulltextové vyhledávání (Kompas), dlouho pro firmu nebylo prioritou. Fulltext se například zapínal až v případě, že odpověď nebyla nalezena v katalogu.

Později Seznam používal pro fulltext cizí technologie (včetně Googlu) a prezentoval se spíše jako médium/portál než vyhledávač (tedy s důrazem na homepage a další služby/vlastní obsah). Situace se nicméně postupně měnila a dnes je Česko jednou z pouhých čtyř zemí, kde domácí hráč nepřenechal hlavní podíl na vyhledávání Googlu. (Další jsou Rusko, Čína a Jižní Korea – ČR je tedy jedinou z těchto zemí, kde se používá latinka.) Konkurenční boj mezi Googlem a Seznamem vede k tomu, že vyhledávací služby pro české dokumenty jsou dnes zřejmě jedny z nejkvalitnějších na světě.

Pár čísel...

Pár čísel…

Hlavní roli převzalo fulltextové vyhledávání na Seznamu v roce 2005. Od té doby firma masivně investuje do této technologie – jak do hardwaru, tak do vývojářů. V roce 2005 pracovali na vyhledávání 4 lidé, letos už 67. Počet indexovaných dokumentů stoupl ve stejném období z 30 milionů na 650. Pro obsluhu vyhledávání je dnes vyhrazeno 250 strojů, robot jich využívá 150. Obvyklou konfigurací těchto systémů je 24 jader a 350 GB RAM. Databázovým řešením je Hadoop (noSQL databáze) – s tím mj. do programovacích jazyků a platforem používaných v Seznamu vstoupila i Java.

Současná čísla: Za jednu vteřinu odpoví fulltext Seznam 350 dotazů, ve špičce je to více než 500. Databáze robota zabírá 35 TB, jeho rychlost se pohybuje mezi 500 a 5 000 URL za vteřinu.
Na tiskové konferenci Seznamu se diskutovalo i o tom, proč v okolních evropských zemích místní dominantní hráči nástupu Googlu nedokázali odolat. Asi hlavní příčinou podle představitelů Seznamu byl fakt, že většina z těchto firem byla koupena telekomunikačními operátory. Svoji uživatelskou základnu se pak snažili co nejrychleji monetizovat, namísto investic do technologií se změnili na „prodeje ADSL“. Seznam nebyl k takové politice nikdy nucen.

seznamácké železo

seznamácké železo

Co se týče budoucnosti a přístupů k hledání: Seznam nechce nasazovat personalizaci, kdy by třeba načtení hlavní stránky map vycházelo z polohy uživatele. Uživatelé přijímají takový přístup spíše záporně. Různí uživatelé (nebo stejní uživatelé z různých počítačů) by při hledání měli dostávat stejné výsledky, nezohledňuje se historie hledání ani se neprohledává pošta uživatelů přihlášených k e-mailu Seznamu. Seznam proto mj. nemusí dnes řešit spory týkající se ochrany soukromí. Personalizaci jako takovou ovšem Seznam neodmítá, tyto techniky však hodlá nasazovat pouze pro mobilní telefony.

Rozdíly mezi přístupem hledání Seznamu a Googlu si může každý hračička zkoušet sám. Obě technologie trochu jinak pracují s víceslovnými dotazy, se synonymy, s ohýbáním češtiny (Seznam používá lemmatizační techniky od roku 2005) nebo i s tím, nakolik se snaží „myslet za uživatele“ (asi ve smyslu, že při hledání jahodového piva je možno do výsledků zamíchat i weby o pivu malinovém). Liší se také přístup k tomu, jak do výsledků vyhledávání zařazovat zpravodajské zdroje/často aktualizovaná obsah.

Do budoucna by Seznam mj. chtěl při vyhledávání více využívat specializované databáze.

Rubriky: ByznysČeské ITInternet

Související příspěvky

Mají státní orgány vstupovat do soukromých interních systémů?
Zprávičky

NÚKIB představuje Národní politiku CVD pro bezpečné hlášení zranitelností

13. 12. 2025
Zprávičky

Peking protestuje proti britským sankcím vůči dvěma čínským kybernetickým firmám

13. 12. 2025
Zprávičky

Macron: Francie by měla zavést věkové omezení pro přístup na sociální sítě

12. 12. 2025
Komerční úspěch 5G: Sítě nové generace dosáhly za tři roky stejných milníků, jako 4G za pět let
Zprávičky

Huawei zvažuje budoucnost své nedávno dokončené továrny ve Francii

12. 12. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Izrael od února zakáže mobilní telefony na základních školách, píše AFP

ČTK
14. 12. 2025

Izrael od února zakáže dětem používat v prostorách základních škol mobilní telefony. Podle agentury

Mají státní orgány vstupovat do soukromých interních systémů?

NÚKIB představuje Národní politiku CVD pro bezpečné hlášení zranitelností

Pavel Houser
13. 12. 2025

Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) zveřejnil Národní politiku koordinovaného zveřejňování zranitelností,

Peking protestuje proti britským sankcím vůči dvěma čínským kybernetickým firmám

ČTK
13. 12. 2025

Čínská vláda odsoudila britské sankce uvalené na dvě čínské společnosti, které se podle Londýna

Macron: Francie by měla zavést věkové omezení pro přístup na sociální sítě

ČTK
12. 12. 2025

Emmanuel Macron potvrdil, že by si přál, aby Francie zavedla povinnost ověřování věku pro

Dopad amerických cel na sektor IT: boj o softwarovou nezávislost

Trump nařídil centralizaci regulace umělé inteligence na federální úrovni

ČTK
12. 12. 2025

Americký prezident Donald Trump nařídil v noci na dnešek centralizaci regulace umělé inteligence. To

Komerční úspěch 5G: Sítě nové generace dosáhly za tři roky stejných milníků, jako 4G za pět let

Huawei zvažuje budoucnost své nedávno dokončené továrny ve Francii

ČTK
12. 12. 2025

Čínská společnost Huawei kvůli pomalému zavádění komunikačních sítí 5G v Evropě a tvrdšímu postoji

Počet kybernetických incidentů v Česku byl v listopadu podle NÚKIB podprůměrný

ČTK
12. 12. 2025

Počet kybernetických incidentů v Česku byl v listopadu podprůměrný. Národní úřad pro kybernetickou a

Jak se GenAI etabluje v podnikových informačních systémech?

OpenAI – od neziskové laboratoře k nejhodnotnějšímu start-upu na světě

ČTK
11. 12. 2025

Před 10 lety, 11. prosince 2015, byla založena americká nezisková organizace pro výzkum umělé

Tiskové zprávy

Podvodníci zneužívají jména EPH Invest a odvolávají se na Českou národní banku

Kyberpohádky učí bezpečnému chování na internetu

OMEN Max od HP: design, výkon a OLED magie pro hráče i kreativce

Acronis EDR s oceněním uživatelské oblíbenosti od MSP poskytovatelů

NÚKIB podporuje upozornění Spojeného království na škodlivé kybernetické aktivity čínských společností I-S00N a Integrity Tech

Datová suverenita v EU: Může k ní pomoci sekundární software?

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Komentujeme

Chvála černých skřínek

Neocloudy – nové slovo, prudký růst?

Pavel Houser
24. 11. 2025

Opět se vše točí kolem GPU a AI. Poskytovatelé cloudových služeb nového typu („neoclouds“) mají v...

Slovník

Empatie

Displej TFT (Thin Film Transistor)

RTB

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy podn Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.