Pro tým vyvíjející RAG pro Seznam Asistenta hledáme nového kolegu nebo kolegyni (klidně i šikovného absolventa), který nám pomůže posunout náš RAG (Retrieval-Augmented Generation) systém na další úroveň. Čeká vás práce na špičkovém produktu s reálným dopadem na miliony uživatelů a možnost pracovat s nejnovějšími trendy v oblasti LLM.
Co je naším hlavním úkolem?
Náš cíl je jasný, ale komplexní: dodat LLM modelu co nejpřesnější kontext, použít k tomu co nejnižší počet tokenů a stihnout to v co nejkratším čase při vysoké zátěži. Pokud vás baví ladit efektivitu a přesnost AI odpovědí, budete u nás jako doma.
Co vás u nás čeká a na co se můžete těšit:
- Vývoj backendových služeb pro Seznam Asistenta v Pythonu se zaměřením na RAG architekturu.
- Práce s moderní infrastrukturou – služby provozujeme jako multi-DC v Kubernetes a data ukládáme a vyhledáváme pomocí Elasticsearch.
- Zapojení do návrhu řešení: budeme společně vymýšlet, jak efektivně čistit, indexovat a servírovat data pro LLM.
- Práce v prostředí postaveném na Linuxu, Kubernetu a CI/CD (GitLab, Argo CD).
- Monitoring systému (Prometheus, Grafana, Kibana, OpenTelemetry).
- Spolupráce v agilním týmu (Scrum), kde má každý hlas a možnost ovlivnit výsledný produkt.
Hledáme člověka, který:
- Umí programovat v Pythonu a chce se v něm dál rozvíjet.
- Chápe, jak funguje RAG (chytne se v pojmech jako embeddings, vektorové vyhledávání, chunking nebo prompt engineering).
- Má chuť učit se nové věci – pozice je otevřená i pro šikovné absolventy
- Zkušenost s Kubernetes nebo Elasticsearch je velkou výhodou, ale pokud ji nemáte, rádi vás to naučíme.
- Rád pracuje v týmu, zapojuje se do technických diskusí a dotahuje věci do konce.