Mailstep: Přehledná, moderní a robustní infrastruktura v AWS pro logistiku
Když řešíte logistiku pro stovky e-shopů, potřebujete spolehlivou moderní infrastrukturu, která vám ideálně dá i podklady pro fakturaci. Přesně o to jsme se postarali ve společnosti Mailstep.
Česká firma Mailstep denně odbaví více než 30 000 zásilek e-shopů různých velikostí. Pro své zákazníky řeší skrze vlastní aplikaci integraci na různé e-shopové platformy i dopravce, a především kompletní vychystání objednávek z e-shopů. V roce 2023 narazila na limity své infrastruktury — byla zbytečně složitá, roztříštěná a zastaralá. Mailstep se proto obrátil na nás. Během dvou týdnů jsme si DevOps převzali a začali řešit optimalizaci.
„Externí spolupráce bývá často loterie. Obzvlášť na tak citlivé oblasti, jako je DevOps, kdy partner dostane pomyslné 'klíče k pevnosti'. S Cookielabem jsme vždy měli pocit, že je pro ně naše bezpečnost a soukromí na prvním místě. Pomohli nám nastavit procesy pro řízení přístupu vývojářů a jiných technických rolí ke zdrojům v AWS a celkově si naši infrastrukturu vzali za svou, a my tak měli pocit, jako by tvořili jeden z interních týmů.“
Příběh spolupráce
Když jsme si převzali DevOps pod sebe, jako první nás čekala analýza toho, v jakém stavu vlastně infrastruktura je. Zjistili jsme, že Mailstep má asi 26 různých AWS účtů, a to i přesto, že jde pořád o jeden cíl — ovládat fulfillment. Zároveň vše běželo na relativně starých verzích různých systémů. Rozhodli jsme se proto infrastrukturu konsolidovat, abychom se vyhnuli technickým problémům a taky ušetřili náklady na DevOps a vývoj obecně.
Prvním krokem byla konsolidace AWS účtů z více než dvaceti na čtyři. Dva obsluhují technické záležitosti, třetí slouží pro přehled nad stavem infrastruktury a přes čtvrtý probíhá fakturace, správa domén atd. Finální úpravy jsme dodělali v říjnu 2024, tedy cca 18 měsíců od převzetí infrastruktury.
Data jsme migrovali tak, abychom neohrozili dostupnost služeb pro klienty Mailstepu. Pro klienta jsme taky připravili jednotný dashboard, ve kterém mají všichni přehled o stavu infrastruktury, propojení na služby třetích stran apod. Dál jsme připravili monitoring a alerting, který upozorní Mailstep, že je někde problém.
Výzvy
Největší výzvou byla samotná složitost a roztříštěnost -26 různých AWS účtů, zastaralé verze systémů a žádný jednotný přehled o infrastruktuře. Vše se muselo konsolidovat a modernizovat bez narušení služeb pro stovky e-shopových klientů Mailstepu. Migraci na 4 účty jsme dokončili s nulovým výpadkem.
Co dál
Díky převzetí správy infrastruktury jsme zjednodušili a zlevnili práci s AWS. V roce 2025 dokončujeme optimalizace — postupně tak procházíme jednotlivé služby a ověřujeme, kolik kapacit na serveru skutečně využívají vůči tomu, kolik by využívat měly. Cílem je nadále snižovat náklady a přinášet moderní přístupy s ohledem na bezpečnost dat, včetně systému pro automatické škálování dle aktuálních potřeb.
Česká firma Mailstep denně odbaví více než 30 000 zásilek e-shopů. Pro své zákazníky řeší skrze vlastní aplikaci integraci na různé e-shopové platformy i dopravce, a především kompletní vychystání objednávek z e-shopů. V roce 2023 narazila na limity své infrastruktury — byla zbytečně složitá, roztříštěná a zastaralá. Mailstep se proto obrátil na nás. Během dvou týdnů jsme si DevOps převzali a začali řešit optimalizaci.
Co jsme dodali
„Mailstep k nám přišel s velkou výzvou — infrastruktura byla roztříštěná, složitá a plná tech depthu. Pro nás to ale byla skvělá příležitost ukázat, jak rychle umíme věci zjednodušit, zpřehlednit a modernizovat. Během pár měsíců jsme postavili robustní, efektivní a bezpečné řešení, které je připravené na další růst. Pro náš tým to byl vlastně docela piece of cake — tohle nás prostě baví.“
Technologie
Příběh spolupráce
Když jsme si převzali DevOps pod sebe, zjistili jsme, že Mailstep má přes 26 různých AWS účtů, a to i přesto, že jde pořád o jeden cíl — ovládat fulfillment. V původním řešení byly zastaralé a neaktualizované nástroje pro správu infrastruktury, například FluxCD ve verzi 0.32 vs v tu dobu aktuální 2.0.
Jako první jsme konsolidovali účty a nahradili starý, komplikovaný systém deploymentu jednodušším a především přehlednějším způsobem. Z více než dvaceti AWS účtů jsme se dostali na čtyři: neprodukcní, produkcní, tooling (observability / CI pipelines) a management účet pro fakturaci a správu domén.
Dále jsme se s klientem rozhodli opustit Flux a zvolili jsme klasickou cestu helm release. Upozadili jsme tak dočasně GitOps, abychom mohli soustředit síly na větší problémy. Data jsme migrovali tak, abychom neohrozili dostupnost služeb.
Monitoring a metriky infrastruktury jsme postavili na Grafana, Mimir a Tempo OSS — nejlevnější řešení s ohledem na zákazníkovy potřeby. Abychom zlepšili fulltextové vyhledávání, zaměnili jsme Grafana Loki za OpenSearch. Pro alerting jsme vybrali Prometheus Alert Manager.
Co dál
V roce 2025 dokončujeme optimalizace a postupně procházíme jednotlivé služby. Přinášíme připravený systém pro automatické škálování workloadu dle aktuálních potřeb postavený na nástrojích KEDA a Karpenter. V dlouhodobějším horizontu je v plánu připravit automatickou platformu, kde budou developeři mít potřebné nástroje k jejich každodenní práci. Tím se zpříjemní Developer Experience, zrychlí vývoj a sníží se závislost na ostatních týmech.