Ve výzkumu řešíme širokou škálu úloh pro Seznam vyhledávání z oblasti strojového učení, zejména zpracování webových stránek, textu či uživatelského chování, příležitostně i obrazu. Jelikož jsme zavedená firma se spoustou uživatelů, máme tak k dispozici velké množství různorodých dat, jejichž kvalitu zaručuje tým Bussiness Inteligence. Jako výzkum řešíme projekt od samého nápadu a formování zadání, přes přípravu dat a návrh hlavních metrik až po spolupráci na nasazení. Modely učíme na našich dedikovaných serverech s grafickými kartami pro větší výpočty. Udržování si přehledu v aktuálních trendech je nedílnou součástí naší práce, proto klademe velký důraz na vzdělávání ať už samostudiem nebo v pravidelných organizovaných reading groups. Výzkumníci mají možnost vycestovat na konferenci či přednášet na univerzitách.

Jsme tak trochu univerzální tým – řešíme zkrátka to, co je zrovna potřeba. Díky tomu se pravidelně dostáváme k pestré škále problémů i různým modalitám. Naši práci je možné potkat napříč celým vyhledáváním. Podílíme se například na enkódování HTML dokumentů, zlepšování relevance a vektorového vyhledávání v obrázkovém vyhledávání, detekci entit v dotazu) nebo třeba detekci botů. Stavíme na moderních, state-of-the-art algoritmech, které si ladíme na míru konkrétním problémům s využitím dat anotovaných našimi vlastními anotátory. Velkým benefitem je také náš vlastní GPU cluster, díky kterému můžeme rychle experimentovat i škálovat. Na projektech rádi přemýšlíme společně, takže se pravidelně potkáváme v kanceláři až třikrát týdně. A když už jsme tam, po obědě si ke kávě často střihneme i partičku ping-pongu.

Co od vás očekáváme

  • Umíte programovat v jazyce Python a navrhovat efektivní algoritmy
  • Orientujete se v problematice strojového učení
  • Ovládáte základy Linuxu
  • Máte vystudovanou vysokou školu relevantní k pozici

Co můžete očekávat

  • Podílení se na formování zadání výzkumné úlohy a analýzy problému
  • Příprava a analýza dat – Python, pandas, (Py)Spark, Polars
  • Učení ML modelů – pracujeme se širokou škálou modelů od rozhodovacích lesů (XGBoost/CatBoost) až po hluboké neuronové sítě (PyTorch)
  • Aplikace state-of-the-art metod pro zpracování jazyka a obrazu
  • Týmová spolupráce při řešení problému a tvorbě kódu – Git, code review
  • Vyhodnocení navržených řešení, interpretace a prezentace výsledků
  • Předávání modelů a kódu do produkce např. pomocí Docker containerů
  • Zajímavou a rozmanitou práci, řešení netriviálních problémů
  • Velká data, možnost anotací
  • Vyrábíme prototypy pro řešení těžkých problémů,
  • Dostáváme věci do produkce, přímý dopad na miliony uživatelů,
  • Vlastní výkonné servery, dedikovaná výpočetní kapacita
  • Sdílení znalostí a zkušeností napříč Seznamem
  • Osobní rozvoj – vzdělávání, reading groups a konference (v případě zájmu i veřejné přednášky na univerzitách a akcích)
  • Super kolektiv a neformální a přátelské prostředí – všichni si tady tykáme a nemáme předepsaný dress code
  • Možnost HO (až 3 dny v týdnu)

Jak probíhá výběrové řízení

  1. Zaslání CV
    Jakmile od vás obdržíme životopis, pečlivě si ho prostudujeme. Pokud budete odpovídat našim představám, ozveme se vám telefonicky.
  2. Telefonní prescreen (cca 10 minut)
    Krátce si zavoláme, abychom si ověřili základní informace – například vaše motivace, dostupnost nebo jazykové znalosti.
  3. Rozhodnutí o postupu
    Na základě prescreenu se manažer rozhodne, zda vás pozve do další fáze výběrového řízení.
  4. Technické úkoly (2 týdny na vypracování)
    Pokud postoupíte, obdržíte zadání dvou úkolů:
    • online programovací úloha,
    • případová studie zaměřená na oblast machine learningu.
  5. Osobní pohovor
    V případě, že budou technické úlohy vypracovány na odpovídající úrovni, pozveme vás na osobní pohovor.
    Pobavíme se o vašem řešení, vaší dosavadní praxi, znalostech i o samotné pozici. Prostor bude i na vaše dotazy.
  6. Rozhodnutí a nabídka
    Po prvním kole pohovoru si obvykle manažeři udělají jasno. Pokud budete tím správným kandidátem, zašleme vám pracovní nabídku.

Seznam.cz, a.s.