Už to je dobré
Mám radost, že vám mohu oznámit, že teď už je vše v pořádku. Je neděle večer, server má load 0.4 a běží už více než 24 hodin bez zádrhelu. Dnešní plánovaný výpadek jsme museli trochu urychlit a provést ho už v pátek v noci a pokud sledujete náš status twitter, víte že to dopadlo dobře.
Dnes bude na serveru Pluto odstávka související s http://t.co/QsliDqd4ci. Za případné komplikace se omlouváme.
— Roští.cz status (@rosti_cz_status) August 21, 2015
Tento servisní zásah jsme měli připravený, takže jsme se výrazně nezasekli. Služby na novém Roští jsme vypnuli kolem 0:30 a kolem 2:30 bylo hotovo. K poškození souborového systému tentokrát nedošlo, takže jsme neměli problémy s nahozením služeb. Jedeme teď na kombinaci Docker+ext4+aufs, což byste měli výrazně pocítit na výkonu IO operací, samozřejmě v tom dobrém slova smyslu 🙂 Kontejnery jsou teď opravdu svižnější.
Btrfs jsme původně vybrali, protože Docker týmem byl označen za stabilní a neměli jsme s ním po celý rok vývoje administrace žádné problémy. Hodně se nám líbili funkce snapshotů, které jsme používali pro zálohování a quote, které nám pomáhali omezovat množství dat, která můžete uložit. Spolehlivost je ale samozřejmě důležitější, takže tyto věci budeme řešit tak, jak jsme je řešili doposud.
Byl to náročný víkend, takže to jen shrnu. Všechno už je v pořádku, systém je teď rychlejší a i když vyšel Docker 1.8. teď rozhodně aktualizovat nebudeme 🙂
Doplněk: Aktualizovat budeme asi až na Docker 1.9, protože 1.8 pro nás nepřináší nic zásadního, ale 1.9 bude podporovat volume pluginy a to nám dá do ruky nástroj, jak decentralizovaně ukládat vaše data. Díky tomu by nás podobné problémy v budoucnu netrápily, protože bychom mohli migrovat vaše aplikace mezi servery v řádu sekund.