Netflix otkrio ozbiljno usko grlo u Linux kernelu pri skaliranju kontejnera na modernim procesorima

Inženjeri kompanije Netflix otkrili su neočekivano usko grlo u performansama prilikom skaliranja kontejnera na modernim cloud serverima. Analiza je pokazala da problem ne potiče samo iz alata poput Kubernetes ili containerd, već iz same arhitekture procesora i načina na koji Linux kernel upravlja fajl sistemom.

Problemi su se pojavili kada su serveri pod velikim opterećenjem počeli da „zamrzavaju“ operacije pokretanja kontejnera, pri čemu su provere stanja aplikacija kasnile i po nekoliko desetina sekundi.

Istraživanje je pokazalo da se uzrok problema nalazi u globalnom mount lock mehanizmu unutar Virtual File System podsistema. Prilikom pokretanja velikog broja kontejnera, runtime mora da izvrši ogroman broj bind mount operacija kako bi mapirao slojeve kontejnerskih slika.

Globalni lock u VFS sloju stvara ozbiljan problem skaliranja

Svaki kontejner može zahtevati desetine mount i unmount operacija, a tokom velikih burst scenarija ukupan broj sistemskih poziva može preći 20.000 mount operacija. Sve ove operacije moraju da pristupe istom globalnom kernel lock-u, što stvara klasično usko grlo u sistemima.

Netflix je takođe utvrdio da se ponašanje sistema značajno razlikuje u zavisnosti od arhitekture procesora.

Na starijim serverima poput AWS r5.metal instanci sa više procesorskih soketa i više NUMA domena, istovremeni pristup deljenim resursima dramatično pogoršava performanse.

Sa druge strane, novije jednoprocesorske konfiguracije poput AWS m7i.metal zasnovane na Intel procesorima ili AWS m7a.24xlarge sa AMD CPU arhitekturom pokazuju mnogo bolje skaliranje zahvaljujući modernijem dizajnu keš memorije i smanjenim NUMA kašnjenjima.

Testiranja su pokazala da faktori poput NUMA topologije, hiperthreading-a i mikroarhitekture keš memorije značajno utiču na to kako se globalni lock konflikti prenose i utiču na čitav sistem.

U pojedinim konfiguracijama čak je i isključivanje Hyper-Threading tehnologije smanjilo latenciju i do 30%.

Da bi rešio problem, Netflix je razmotrio dva pristupa: korišćenje novih kernel mount API-ja koji eliminišu globalni lock i optimizaciju overlay fajl sistema kako bi se smanjio broj mount operacija po kontejneru.

Kompanija je izabrala drugi pristup, reorganizujući način na koji se slojevi kontejnerskih slika montiraju. Time je broj mount operacija smanjen sa linearne složenosti O(n) na konstantno vreme O(1) po kontejneru, čime je praktično eliminisano usko grlo u kernelu.

Ovo istraživanje naglašava važnu lekciju za industriju cloud infrastrukture: stabilno skaliranje modernih distribuiranih sistema zahteva duboko razumevanje kompletnog softverskog i hardverskog steka: od kontejnerskih platformi i fajl sistema do CPU mikroarhitekture, piše InfoQ.

Linux Netflix

Vrati se na početak

Drugi su čitali

Softver i servisi
13.04.2026
3 min

Android 17: Objavljena lista modela na koje stiže update

Android 17 stiže na brojne pametne telefone, a objavljena je i lista modela koji će dobiti nadogradnju i onih koji ostaju bez dalje podrške

Gejming
17.04.2026
2 min

Sony PS6 donosi punu kompatibilnost sa prethodnim modelima i neočekivano nisku cenu

Sony PS6 donosi podršku za PS4 i PS5 igre, RDNA 5 arhitekturu i znatno niže troškove proizvodnje uz agresivnu cenu

Uređaji
18.04.2026
2 min

USB trik za pametne televizore i kako zaobići ograničenje od 100 Mbps na Ethernet portu

USB Ethernet adapter omogućava pametnim televizorima brzine do 1 Gbps i zaobilazi ograničenje od 100 Mbps na ugrađenom portu

Gejming
15.04.2026
3 min

PlayStation 6 u 3 verzije: Glavna, jeftinija i ručna konzola

Izgleda da kompanija Sony planira tri PS6 uređaja za 2027. godinu, a uz budžetski PlayStation 6 model stižu i flagship konzola i handheld

Softver i servisi
16.04.2026
2 min

Samsung One UI 9 je sledeće veliko ažuriranje softvera, ovo je spisak svih Galaxy uređaja koji ga dobijaju

One UI 9 baziran na Android 17 verziji stiže na brojne Galaxy uređaje, uključujući: S, Z, A i Tab serije

Testovi

Telefoni
15.04.2026
8 min

Motorola G77 - u skladu sa očekivanjima

Na test Benchmark redakcije stigao je još jedan predstavnik G serije sa kojom se družimo već duži niz godina – Motorola G77. Koliko i šta nudi?

Pametni satovi
06.04.2026
10 min

Ne samo za trčanje - Huawei Watch GT Runner 2 recenzija

Huawei Watch GT Runner 2 je pametni sat namenjen trčanju, ali sa mogućnostima koje ga preporučuju svima. Kako radi, pročitajte u našoj recenziji.

Netflix otkrio ozbiljno usko grlo u Linux kernelu pri skaliranju kontejnera na modernim procesorima

Globalni lock u VFS sloju stvara ozbiljan problem skaliranja

CarPlay Ultra stiže u još automobila, Apple izlazi iz okvira luksuznog segmenta

Windows 11 Start meni konačno dobija potpunu kontrolu, Microsoft uvodi mogućnost podešavanja i bolje performanse

Pura X Max stiže sledeće nedelje, Huawei priprema spektakl sa novom generacijom uređaja

120 W nije prava snaga već trik - istina o punjačima otkriva kako se korisnici dovode u zabludu

Ne nasedajte na priče o 10x boljim PS6 performansama, realan skok FPS-a je oko tri puta

Samsung Galaxy AI naočare stižu ove godine, Android XR i AR će imati lep dizajn i nosićemo ih svaki dan

Android 17 stiže u junu, a ovi telefoni ga prvi dobijaju

Android dobija zaštitu od lažnih poziva, Google uvodi „Verified caller“ na sistemskom nivou

USB trik za pametne televizore i kako zaobići ograničenje od 100 Mbps na Ethernet portu

Novi izveštaj otkriva da Apple i Google aktivno promovišu aplikacije za “razgolićavanje” kroz pretragu i oglase

Potvrđene zvanične Motorola Edge 70 Pro specifikacije - stiže sa 144 Hz ekranom i baterijom od 6500 mAh

Gemini postaje novi „šerif“ sa zadatkom u Google Maps-u - AI od sada briše lažne recenzije pre objave

Globalni lock u VFS sloju stvara ozbiljan problem skaliranja

Ostani u toku