Servrar och virtuella maskiner

Server för byte av användning: Optimera prestanda i hosting

Jag kommer att visa dig hur du kontrollerar servrarnas swap-användning på ett målinriktat sätt så att arbetsbelastningen inte stannar av under belastning och inga prestanda avtryckarproblem. Jag förklarar orsaker, nyckeltal, swappiness-inställningar, storleksrekommendationer och praktiska tuningsteg för minne byte av värd.

Centrala punkter

Swappiness Minska: Undvik aggressiv outsourcing
Storlek kontrollera: Anpassa swap till RAM och arbetsbelastning
IO skydda: SSD-placering, medveten användning av Zswap/ZRAM
Övervakning etablera: Sidfel, kswapd, fördröjning
Arbetsbelastning anpassa: Balansering av cache- och DB-buffertar

Vad swap egentligen gör - och när det gör dig långsammare

Swap utökar det fysiska RAM-minnet genom att flytta sällan använda sidor till SSD eller HDD och skyddar processer från OOM-dödaren, vilket hjälper mig i nödsituationer. Buffert ger. Linux avlastar opportunistiskt för att ge aktiva sidor mer utrymme och behålla sidcachen, men för mycket aktivitet ökar IO-belastning. Så snart systemet växlar ofta mellan RAM och swap finns det risk för thrashing och därmed märkbar latens. Speciellt vid tung webbhosting med PHP, databas och Node.js konkurrerar cachen, PHP-arbetaren och DB-bufferten om minnet. Jag håller därför swap tillgängligt som ett skyddsnät, men minimerar användningen av det i normal drift.

Känna igen symptom på hög swap-användning

Jag kontrollerar först fri -h och vmstat, eftersom höga swap-in/swap-out-frekvenser indikerar flaskhalsar. Om frekvenserna förblir låga och RAM-minnet är ledigt fungerar systemet vanligtvis normalt och använder bara swap opportunistiskt. Men om sidfelsfrekvenserna och IO-kön ökar, ökar applikationsfördröjningen och förfrågningarna blir långsammare. I loggar ser jag indikationer på upptagna arbetare och långsamma förfrågningar som inträffar samtidigt som swap-topparna. För mer grundläggande information om virtuellt minne hänvisar jag dig till denna kompakta introduktion till virtuellt minne, vilket hjälper mig med kategoriseringen.

Fördelar och risker med minnesbyteshosting

Jag använder swap för att dämpa RAM-toppar och för att hålla igång kritiska tjänster, vilket på kort sikt kan vara mycket användbart. Fel undviks. Det innebär att mindre VPS-instanser kan klara sig med mindre RAM-minne, vilket kan minska kostnaderna i euro så länge IO-belastningen håller sig inom gränserna. Men om för mycket byts ut hamnar SSD/NVMe klart efter RAM-minnet och förfrågningarna stannar av. Dessutom kostar komprimering (ZRAM) CPU-tid, som applikationer hellre vill använda för verkligt arbete. Swap är därför inte en ersättning för mig, utan ett skyddsnät som jag aktivt kontrollerar.

Swappiness: den viktigaste justerskruven

Kärnvariabeln vm.swappiness (0-100, standard vanligtvis 60) styr hur tidigt systemet avlastar sidor, och jag minskar den till 10 för hosting-arbetsbelastningar. Tillfälligt testar jag med sysctl vm.swappiness=10, Jag skriver permanent vm.swappiness=10 på /etc/sysctl.conf. På SSD-värdar resulterar detta i mindre swapping och mer utrymme för sidcachen. Jag övervakar sedan IO, latenser och arbetsuppsättningar för att bekräfta effekten. Om nyckeltalen förblir stabila behåller jag inställningen och dokumenterar förändringen för senare revisioner.

Optimal swapstorlek för vanliga servrar

Jag anpassar swapstorleken till RAM-minnet, arbetsbelastningen och eventuell viloläge, eftersom jag hittar filer som är för stora Minne och filer som är för små minskar bufferten. För typiska hosting-servrar utan viloläge planerar jag måttliga värden och prioriterar mer RAM framför enorma swapvolymer. För knappa VPS-instanser kan 1,5-2x RAM vara vettigt tills en verklig uppgradering är möjlig. Om du har gott om RAM-minne kan du ofta dra nytta av mindre men tillgängliga swap-områden för att undvika krascher. Jag använder följande tabell som utgångspunkt och justerar den enligt uppmätta värden:

RAM-storlek	Byte utan viloläge	Byt med viloläge
≤ 2 GB	2x RAM-minne	3x RAM
2-8 GB	= RAM	2x RAM-minne
8-64 GB	4–8 GB	1,5x RAM-minne
> 64 GB	4 GB	Rekommenderas ej

Bytesplacering och avancerad teknik

Jag föredrar swap-filer framför partitioner eftersom jag kan justera storleken dynamiskt och göra ändringar snabbare. leva gå. Om swap-området ligger på separat SSD-lagring konkurrerar det mindre med operativsystemet om IO. För mycket små virtuella datorer använder jag Zswap eller ZRAM som ett test för att minska IO, men håller ett öga på CPU-användningen. Jag begränsar överengagemang på ett tydligt sätt och sätter gränser för tjänster så att ingen process driver maskinen till thrashing. I slutändan är det en mätbar effekt som räknas: mindre latens, tystare IO och konsekventa svarstider.

Övervakning: vilka nyckeltal räknas verkligen?

Jag mäter RAM-användning, sidcache, swap in/out, aktiviteten hos kswapd och IO-köer, eftersom dessa värden skickar mig signaler tidigt. Om swap-förflyttningen ökar korrelerar jag detta med applikationslatens och frågestunder. Jag kontrollerar också mindre och större sidfel för att upptäcka dyra minnesåtkomster. För att hjälpa mig att förstå buffertstrategier använder jag den här guiden för att Användning av buffert och cache. Det är först när mätvärdena och loggarna visar ett konstant tryck som jag ingriper och ändrar inställningarna.

Hur kärnan väljer sidor: en djupare titt på Reclaim

För att kunna ställa in på ett målinriktat sätt förstår jag de interna listorna: Linux skiljer mellan anonyma sidor (heaps/stackar) och filstödda sidor (sidcache). Båda är kopplade till LRU-listor (aktiva/inaktiva). Om minnet är hårt belastat försöker kärnan först göra sig av med inaktiva, filbaserade sidor (snabbt, eftersom de kan laddas om från disken). Om för många anonyma sidor är aktiva måste de flyttas till swap-minnet, vilket är dyrare. En hög vm.vfs_cache_tryck påskyndar borttagningen av dentries/inodes, vilket frigör utrymme men kan leda till fler filåtkomster på webbservrar. Jag brukar hålla den runt 50-100 och se hur cache-träfffrekvensen och latensen förändras.

Jag påverkar skrivvägarna via vm.dirty_background_bytes/vm.dirty_bytes (eller kvotvarianterna). Dirty-gränser som är för höga skjuter bara upp problemet och genererar senare stora återskrivningar som saktar ner swap-återvinningen. Jag föredrar bytebaserade gränser eftersom de fungerar mer exakt på system med stort RAM-minne. En annan nödlösning är vm.min_fria_kbytesOm detta värde är för lågt kommer återvinningen att hamna i hektiska cykler; för högt slösar det RAM-minne. Jag brukar låta det här värdet vara standardvärdet för distributionen, såvida jag inte konsekvent ser „low free watermarks“ i dmesg.

PSI och kswapd: Korrekt tolkning av ledande indikatorer

Förutom klassiska mätvärden använder jag Information om tryckstopp under /proc/tryck/minne. Hög vissa eller . full Värden över flera sekunder visar mig att uppgifter väntar på minne. Detta är ofta det första tecknet innan användarna märker av latensen. Samtidigt tittar jag på CPU-tiden för kswapdOm den permanent stiger över några få procent går Reclaim varm. Med vmstat 1 Jag är uppmärksam på si/så (swap-in/out) och r/b (kör/blockera kö). Konsekvent hög så-värden tillsammans med växande b-Då ingriper jag konsekvent.

Cgroups v2 och systemd: Avsiktlig begränsning av swap

I miljöer med flera hyresgäster eller containrar förhindrar jag att en enda tjänst äter upp alla reserver. Med cgroups v2 ställer jag in minne.max (hård gräns), minne.hög (mjuk chokereglering) och minne.swap.max (swap-gräns). Under systemd använder jag per tjänst MemoryMax= minne, MinneHög= och MemorySwapMax= minnesbyte i enhetens åsidosättningar. Detta innebär att PHP-FPM inte kan driva hela systemet till swap, medan databaserna förblir reaktiva. För bursts kan en smal minne.hög plus måttlig MemorySwapMax= minnesbyte, istället för att riskera svåra OOM:er. Jag dokumenterar dessa gränser för varje tjänst och håller dem uppdaterade i granskningsprocessen.

Skapa, förstora och prioritera swap-filer på ett snyggt sätt

I praktiken behöver jag snabba, reproducerbara steg:

Skapa utbytesfil: fallocate -l 8G /swapfile && chmod 600 /swapfile && mkswap /swapfile
Aktivera: swapon /swapfile; permanent via /etc/fstab med /swapfile ingen swap sw sw,pri=5 0 0
Justera storleken: swapoff /swapfile, fallocate -l 12G /swapfile, mkswap /swapfil, swapon /swapfile
Flera swappar: snabbare NVMe med högre pri prioritera; med swapon --show --output=NAME,PRIO,SIZE,USED kontroll

På mycket IO-svaga system föredrar jag att minska swapstorleken eller placera swap på snabbare databärare i stället för att låta systemet långsamt swappa sig självt „till döds“.

Zswap och ZRAM: när komprimering verkligen hjälper

Zswap komprimerar sidor som ska swappas ut i den RAM-backade poolen och minskar därmed fysisk IO. Detta skyddar SSD-enheter, men kostar CPU-tid. För virtuella datorer med få kärnor testar jag först lz4 (snabb, svagare komprimering) och observerar om CPU-topparna ökar. Jag ersätter selektivt ZRAM med klassisk swap på mycket små instanser för att förbli nästan IO-fri - jag planerar mer CPU för detta. Jag håller medvetet komprimeringen liten (t.ex. 25-50% RAM för ZRAM) för att undvika att skapa nya flaskhalsar. Så snart CPU-bundna arbetsbelastningar börjar snubbla, reviderar jag denna optimering.

THP och fragmentering: dolda latensbromsar

Transparent Huge Pages (THP) kan hjälpa till med JVM:er eller databaser, men kan också belasta reclaim och swap i blandade hostingmiljöer. Jag använder THP på madvise, så att endast arbetsbelastningar som uttryckligen använder det gynnas. I händelse av märkbar minnesfragmentering planerar jag rullande omstarter av minnesintensiva tjänster för att rensa ut högar som har skjutits. För MySQL/MariaDB kontrollerar jag också om InnoDB-buffertpoolen är tillräckligt stor i förhållande till det totala minnet så att Linux sidcache inte svälter - dubbla cacher kostar RAM och ökar swap i onödan.

NUMA och hostar med flera uttag

NUMA spelar en roll på större bare-metal-värdar. Obalanserad minnesåtkomst ökar latenserna och påskyndar återvinningen. Jag distribuerar arbetsbelastningar över numactl --interleave=all eller knyta specifika tjänster per nod. Jag håller kritiska tjänster som utlöser många sidcacheåtkomster (t.ex. Nginx) nära datavägarna; jag kapslar in minneskrävande batchjobb och ger dem snävare cgroup-gränser vid behov så att NUMA-överflöden inte driver hela systemet till swap.

Processdiagnostik: vem byter egentligen?

Om systemmätvärdena är alarmerande identifierar jag orsaken på processnivå: smem -knr visar mig PSS/USS (realistiska minnesandelar), pmap -x segmentfördelningen. I /proc//status Jag kontrollerar VmRSS, VmSwap och oom_score_adj. Hög VmSwap-värden för LRU-ovänliga mönster (många anonyma, lite använda sidor) är en kandidat för begränsningar eller kodoptimering. Jag använder också pidstat -r 1, för att se felfrekvenser per process och jämföra detta med applikationsfördröjningar.

Körböcker, SLO:er och eskaleringsnivåer

Jag definierar tydliga gränsvärden per värdklass, t.ex.: kswapd-CPU < 5% i ett 5-minuters genomsnitt, större fel < 50/s/kärna i normal drift, PSI-minne vissa < 10% över 60 år. Om två mätvärden bryts samtidigt ingriper jag i följande ordning: kontrollera swappiness, tillfälligt strypa arbetare/buffertar, justera swapplacering och prioriteringar, (av)aktivera komprimering, öka RAM-minnet vid behov. Dessa runbooks är en del av mitt incidentrespons så att team kan agera på ett reproducerbart sätt och Fördröjning förblir under kontroll.

Felsökning: typiska orsaker och snabba lösningar

Om swapfrekvensen ökar kontrollerar jag först minneskrävande tjänster och begränsar dem med cgroups eller serviceinställningar. Jag kontrollerar sedan om det finns för många PHP-arbetare, för stora DB-buffertar eller en för liten sidcache. Jag minskar swappiness, städar upp temporära cacher och flyttar loggrotationer från topptider. Om IO-kön förblir permanent hög flyttar jag swap eller minskar den för att minimera IO-konkurrensen. Om detta inte är tillräckligt ökar jag RAM-minnet och mäter igen tills latensen är stabil på en låg nivå.

Tuning för PHP, databaser och Node.js

Med PHP maximerar jag träffar på hela sidan eller OPcache så att mindre RAM används för upprepad kompilering och därför Svarstid minskar. I MySQL/MariaDB balanserar jag buffertpoolen och query-cachen mot sidcachen för att undvika dubbelcachning. För Node.js sätter jag gränser för heap och övervakar garbage collection så att Evenemangsslinga inte vacklar. Jag förhindrar också minnesfragmentering genom utrullningar som regelbundet startar om tjänster och upptäcker läckor. En kort och djupgående titt på Minnesfragmentering hjälper till att upptäcka sådana smygande problem snabbare.

Containrar och hosting-stackar: praktiska exempel

I containermiljöer sätter jag en hård minnesgräns per pod eller tjänst och tillåter bara en måttlig mängd swap. För PHP-FPM beräknar jag minne per arbetare (RSS) plus utrymme för sidcachen. Exempel: 512 MB RAM, 30 MB/arbetare verklig förbrukning - då är 8-10 arbetare realistiska, inte 20. För Node.js ställer jag in --max gammalt utrymme-storlek medvetet under den fysiska gränsen så att GC inte kommer under press och kärnan inte aggressivt swappar anonymt minne. För databaser planerar jag fasta budgetar, separerar dem från webbnivån där det är möjligt och ger operativsystemet tillräckligt med utrymme för filcacher.

Kostnader, hårdvara och när du ska uppgradera RAM

Jag beräknar motsvarande värden i euro: Om swap printing skapar permanent fördröjning, motiverar extra RAM snabbt priset och skapar verklig fördröjning. Effekt. NVMe minskar IO-latens, men ersätter inte flyktigt minne. Innan jag utökar hårdvaran optimerar jag swappiness, buffertar och antalet arbetare för att öka effektiviteten. Om användningen förblir hög planerar jag ett RAM-minneshopp i förnuftiga steg istället för att bara öka swap. Den här sekvensen förhindrar felinvesteringar och ger mig tydliga mätpunkter för senare jämförelser.

Kontrollera: Byt användningsserver om 15 minuter

Jag börjar med fri -h, vmstat 1 och kontrollera Byta-rörelse, sidfel och IO-köer. Sedan ställde jag in vm.swappiness=10, belastning sysctl och observerar nyckeltalen i fem minuter. Om det stämmer skriver jag ner inställningen och dokumenterar den aktuella statusen. I nästa steg korrigerar jag antalet arbetare och DB-buffertar som ersätter sidcachen. Slutligen skapar jag larm som varnar mig för avvikande värden innan användarna märker dem.

Kortfattat sammanfattat

Jag använder Swap som en säkerhetssele, men håller dess användning låg så att Fördröjning exploderar inte och inga prestandaproblem uppstår. Den största hävstången är fortfarande förnuftig swappiness, i kombination med en swapstorlek som matchar RAM-minnet och arbetsbelastningen. Jag övervakar kswapd, sidfel och IO-kö, jämför värden med applikationsloggar och agerar tidigt. För mindre VPS:er avlastar minnesbyten på kort sikt, medan verklig avlastning kommer med mer RAM. Genom att följa den här sekvensen kommer servrarna att hålla sig responsiva, minska driftstopp och skydda budgeten.