サーバーと仮想マシン

Linuxにおけるサーバー・ページ・キャッシュの退避とメモリ印刷の理解と最適化

その方法をお見せしよう。 ページキャッシュ サーバーが確実かつ迅速に応答できるように、Linuxにおけるevictionとメモリプレッシャーについて説明します。カーネル内のコアメカニズム、日常的なホスティングにおける典型的な落とし穴、モニタリング、チューニング、キャッシュ戦略の具体的な手順について説明します。 実際の関連性.

中心点

LinuxページキャッシュファイルブロックをRAMに透過的にキャッシュすることで、IOアクセスを削減。.
メモリー印刷RAMが不足すると、退避やスワッピングを余儀なくされ、OOMを引き起こす可能性がある。.
立ち退き戦略LRUの変種は、頻繁に使用されるページを優先する。.
多層キャッシュカーネル、ストレージ、アプリのキャッシュは互いに影響し合う。.
チューニングとモニタリング重要な数字を読み、パラメーターをテストし、スラッシングを避ける。.

Linuxページキャッシュの仕組み

Linuxカーネルは、頻繁に読み込まれるファイルブロックをRAM上のページとして保持するため、読み取りアクセスはメモリからではなく ブロックデバイス [9].このメカニズムは透過的に機能する。何がキャッシュに残り、何がキャッシュから移動するかをカーネルが決定するため、アプリケーションを適応させる必要はない。 キャッシュ・ヒット率 増加する。フリーRAMは未使用のままではなく、キャッシュとして臨機応変に機能するため、実行中のサービスの応答性が向上する[9]。同じファイルに再度アクセスする場合、カーネルがRAMからデータを供給し、高価なデバイス・アクセスを減らすため、待ち時間が短縮されます。 レイテンシー プレスを紹介する。メカニックと機会についてのより詳細な入門書として、このわかりやすいガイドがある。 Linuxページキャッシュ, 私はこの曲を伴奏に使うのが好きなんだ。.

メモリープレッシャーを理解し、早期に気づく

タイトなRAM メモリー印刷カーネルは不足分を登録し、キャッシュをクリアし、変更されたページを書き戻し、必要に応じてスワップにアクセスする[9]。なぜなら、過度に積極的な立ち退きはIO負荷を増加させ、レスポンスタイムを変動させるからである。 ユーザー・エクスペリエンス 雲。重圧がかかると、プロセスを終了させたりサービスを中断させたりするOOMキラー・イベントのリスクが高まるため、ボトルネックが深刻化する前にリザーブや警告のしきい値を計画する[9]。遠隔測定でスワップ・イン/アウト・レートとIOウェイトが一貫して高いことがわかったら、RAM容量を増やすか、アプリケーション・キャッシュを減らしてカーネルにページ・キャッシュのためのスペースを与える。 レジリエンス リフティングを行う。これにより、突発的な負荷のピークが、無限のライトバックやスワップサイクルとなり、生産的なワークロードの妨げとなることを防ぐことができる[9]。.

カーネルにおける立ち退きメカニズム：LRUとその仲間たち

立ち退きにおいて、Linuxは次のような戦略を用いる。 LRU は似ている：頻繁に使用されるページは残り、めったに使用されないページが先に解放される[9]。変更されていないページはすぐに破棄できますが、変更された（ダーティな）ページはカーネルが解放する前にまず記憶媒体に流れます。 書き込み待ち時間 影響を受ける。ページがリスト間を移動するのは、プロセスの読み込みや変更の頻度によるもので、プレッシャーがかかると、カーネルはこのサイクルを加速させ、実行中のタスクがメモリを受け取れるようにする[9]。ロードされたばかりのデータがすぐにまた移動されるのは致命的である：このようなスラッシングはパフォーマンスを低下させ、デバイスへのアクセスを繰り返すことになり、時間とメモリを浪費する。 ジッター が発生する。メモリを大量に消費するプロセスを制限し、ダーティ・ライトバック・パラメータを微調整し、ウォーム・データ・セットをメモリに保持することで、ホット・データがより長く存在し、IOカーブがより滑らかになるようにすることで、これに対抗することができる。.

カーネルキャッシュ、ストレージキャッシュ、アプリキャッシュの相互作用

いくつかのキャッシュ層が連携している：カーネルはファイルブロックをRAMに保持し、RAIDコントローラやSANシステムはその下にバッファを保持し、オブジェクトキャッシュや バッファプール [9].なぜなら、大きすぎるアプリ・キャッシュはカーネルの息の根を止め、ファイル・キャッシュを弱体化させ、全体的なレイテンシを増大させる可能性があるからだ。逆に、ページ・キャッシュの退避が速すぎると、ホット・データはもう少しRAMがあればメモリに残る可能性はあるものの、ストレージ・システムに頻繁なアクセスを強いることになり、全体的なレイテンシが増大する。 IO負荷 が削減されるだろう。目標はバランスである。アプリケーション・キャッシュは明確な効果を得るのに十分な大きさであるが、カーネルが1メガバイトごとに争わなければならないほど大きくない。特にデータ集中型のワークロードでは、レイヤーごとの測定に頼ることになる。キャッシュの分布と使用に関する仮定は、しばしば誤解を招き、間違った調整ネジに触れてしまうからだ。.

ファイルシステムとマウントオプション：キャッシュとレイテンシーへの影響

ファイルシステムとマウント・パラメーターは、カーネルがメタデータを保存し、ページを書き戻す速度を決定する。. relatime が標準になり、更新時間が大幅に短縮された。 ノータイム, 不要なメタデータの書き込みを節約する。. 怠け者 はinodeへのタイムスタンプの書き込みを遅らせ、セマンティクスを壊すことなくピークを滑らかにする。私はデフォルトでext4のままです。 data=ordered, なぜなら、妥当なレイテンシできれいな一貫性が得られるからである。ノーバリア)サブ構造に安全な書き込みキャッシュ・バッテリーがない場合。XFSとext4では、メタデータキャッシュの挙動が若干異なります。 デントリー- そして iノード-キャッシュを直接使う。 vm.vfs_cache_pressure を直接使用しています。SSDでは破棄非同期または定期的 fstrim-VFSのメタデータキャッシュは、ディレクトリとルックアップのオペレーションを驚くほど高速に保つ[9]。VFSのメタデータ・キャッシュは、ディレクトリとルックアップ操作を著しく高速に保つ[9]。.

ウェブサーバーの日常：ウォームアップ、負荷ピーク、バックアップ

デプロイ後 ページキャッシュ 冷えた状態で、多くの初期アクセスがデバイスにヒットし、そのとき初めてヒートパスが蓄積される。十分なリクエストで頻繁に使用されるファイルがロードされると、キャッシュが有効になり、ホットデータを保持するのに十分なRAMが残っている限り、レスポンスタイムは顕著に正常化します。キャンペーン、クーロンジョブ、またはレポートによって引き起こされる負荷のピークは、メモリを圧迫し、立ち退きの引き金となります。一方、シーケンシャルリードによるパラレルバックアップは、コールドデータを再ロードし、ホットデータを置き換えます。アセットと頻繁に使用されるエンドポイントに特別に触れるウォームアップルーチンは、ピーク時の前にキャッシュが存在するようにするために有用である。 遅延ピーク を最小限に抑えることができる。共有ホストでは、プレッシャーを分散し、スラッシングしているサービスからの相互干渉を減らすために、メモリ集約的なタスクを時間的に分離している。.

リードアヘッド、ダイレクトI/O、キャッシュ汚染を避ける

シーケンシャル・リーダーの利点 リード・アヘッド, その結果、ランダムなパターンに苦しむことになる。各デバイスの値をチェックする リードアヘッド そして、明らかにシーケンシャルなジョブには高めに設定し、ランダムな負荷の高いワークロードには低めに設定します。フルバックアップや大規模スキャンでは、キャッシュ汚染は避ける。 O_DIRECT-サポートまたは posix_fadvise(DONTNEED) 何ギガバイトものコールドデータが、ホットデータをキャッシュから押し出すのを防ぐためだ。アプリケーションが直接I/Oを使用できない場合は、少なくとも優先順位を制限する(ionice, nice)、またはcgroupsを使用してIOスループットを調整し、ウェブトラフィックが恩恵を受け続けるようにする。手動で空にするには ドロップキャッシュ 私は、メンテナンス・ウインドウの時だけ、そして、その後にしか使わない。同期, なぜなら、調整されていないトリガーによるフラッシュは、まさに私が避けたいレイテンシのピークを発生させるからだ。データベース・エクスポートの場合、ストリーム・リードが有効であることが証明されている。 アドバンス・シーケンシャル これは、カーネルがリード・アヘッド戦略を適応させる方法である[9]。.

モニタリング：私が常に注視している主な数字

クリーンなモニタリングで私は次のことを認識した。 メモリー印刷 早め：使用RAM、使用可能メモリ、ページキャッシュの割合、アプリケーションキャッシュとの関係をチェックする。また、調整を行う前に原因と結果を明確に分けるために、スワップ使用率、スワップイン・アウト率、IO待ち、物理的な読み書きアクセス、リクエストのエラー率も監視している。時系列は、ボトルネックがピーク時にのみ発生するのか、それとも永続的なものなのか、また設定変更が実際に効果を上げているのかどうかを示してくれる。決定チューニングやキャパシティのためです。私は、デプロイ時間、バックアップウィンドウ、トラフィックのピークと立ち退きやIOのピークを関連付けて、パターンを視覚化し、プランニングを検証しています。このような視点がないと、最適化は盲目的になってしまうので、私は必死のアドホックな反応ではなく、意味のあるしきい値を持つアラームに投資しています。.

緊急時のツールと診断パス

待ち時間が増えたら、まず /proc/meminfo と確認する。 メモ使用可能, キャッシュ, バッファ, Active(ファイル), 非アクティブ(ファイル), ダーティ そして ライトバック. .そして、次のものを届ける。 /proc/vmstat そして vmstat 1 ダイナミクス pgfault/pgmajfault, ページスキャン/盗品, kswapd-活動と ワーキング・セット・デフォルト ホットなデータが落ちているかどうか教えてほしい。と iostat -x 1 私はデバイスの飽和とキューの深さを認識している、, pidstat -r -d 誰がファイルバックされたRAMを食っているかを明らかにする。. スラブトップ を使用する際、特大スラブ（デントリ／インポーズ）を認識するのに役立つ。 vm.vfs_cache_pressure が低すぎる。特に価値があるのは /proc/pressure/memory (PSI）：持続的に高い いくつか- そしてフル-この値は、顕著なシステムのイナーシャと直接相関しており、アラームをシャープにし、systemd-oomdを感覚的に設定するのに理想的です。.

カーネル・チューニング：スワップネス、vfs_cache_pressure、ダーティ・ライトバック

Linuxのパラメーターは、私に次のような柔軟なレバーを与えてくれる。 立ち退き vm.swappinessは、カーネルがどの程度スワップにページをプッシュするかを決定する。 ワークロード vm.vfs_cache_pressureは、inodeキャッシュとdentryキャッシュをどの程度集中的にクリアするかを制御します。これにより、ファイルシステムのメタデータが迅速に利用可能になり、ディレクトリへのアクセスが高速化されます。dirty_background_ratioとdirty_ratioは、変更されたページが適切なタイミングでメディアに送信され、メモリのピークが強制フラッシュに傾かないように、非同期書き込みと強制書き込みのしきい値を定義します。以下の表は、その効果と注意点をまとめたものである：

パラメータ	低価値	高価値	実践編
vm.swappiness	スワップは遅くまで使用される	以前のスワッピング	IOに敏感なウェブサーバでは、かなり低めに設定されることが多い。
vm.vfs_cache_pressure	メタデータが長く残る	より迅速な避難	小さなファイルに素早くアクセスする必要がある場合は、ファイルサイズを小さくする。
ダーティ・バックグラウンド・レシオ	以前の非同期書き込み	もっと汚いページ	フラッシュピークが高すぎる。
ダーティレシオ	強制洗浄の頻度が減る	より大きな強制洗浄	たとえライトバック-カーブをセンターで調整

ページングとスワッピングがどのように実世界のパフォーマンスを形成しているか、より深く理解するためには、以下を見る価値がある。メモリのページング, そうすれば、IOコストとキャッシュの範囲を賢明に比較検討することができる。負荷テストとロールバックオプションを使って、すべての変更を検証しています。ワークロードの反応はさまざまで、メモリ、IO、レイテンシのバランスは微妙なままだからです。構造化された測定がなければ、想定される利益を即座に相対化し、新たなボトルネックを生み出す副作用のリスクがある。.

スワップ戦略：Zswap、ZRAM、高速NVMe

スワップは敵ではなく、道具である。. ツースワップ は圧縮されたフロントページをスワップの前に置き、IOを減らす。. ZRAM これは小規模なインスタンスで、ディスクに負荷をかけずにOOMスパイクを抑えるのに役立つ。CPUオーバーヘッドに注意：利用率の高いコアでは、積極的な圧縮はレイテンシーをシフトさせる可能性がある。本当のスワップがNVMe上にある場合、次のように変更する。 vm.swappiness しかし、永久的なスワップイン/アウトの波は、RAM不足または過剰なアプリ・キャッシュの症状である[9]。ライトバックについては、私はバイトバリアント(ダーティバイト, ダーティ・バックグラウンド・バイトこうすることで、パーセンテージの値が大容量のメモリで膨大なフラッシュにつながるのを防いでいる。.

アプリケーション関連のキャッシュ：サイズ、利点、副作用

HTTPページキャッシュ、Redis/Memcachedなどのオブジェクトキャッシュ、データベースバッファプールの高速化 アプリケーション サイズを正しく設定すれば、顕著になる [9]。大きすぎるキャッシュは、カーネル・ページ・キャッシュを置き去りにし、メモリ・プレッシャーを増大させ、カーネルに頻繁な立ち退きを強いる。私は控えめに始めて、ヒット率、レイテンシ、RAMの圧力を測定し、カーネルを遅くするメモリを消費するだけでなく、実際の利益を確保するためにのみ拡張する。 効率性 リフティングがある。CMSやウェブアプリでは、適切に設定されたページキャッシュがリクエストごとの動的世代数を大幅に削減し、CPUとIOを緩和し、間接的にメモリへの負荷を軽減します[2][9]。最終的に、重要なのは合計です。カーネルキャッシュとアプリケーションキャッシュが一緒になって初めて、ピークを避け、一定の応答時間を提供するスムーズな流れが生まれます。.

ホスティング・セットアップの実践的ガイドライン

十分に計画している RAM プロセス・メモリだけでなく、カーネル・キャッシュやアプリケーション・キャッシュのためのリザーブも意図的に確保し、ホットなデータをメモリに残せるようにしています。データベース・バッファ・プール、オブジェクト・キャッシュ、カーネル・ページ・キャッシュは、それぞれ十分なスペースが与えられているので、お互いの速度を低下させることなく連携して動作する。私にとって、優れたモニタリングは運用の一部だ：私は、忍び寄る悪化を素早く認識し、対策を開始するために、メモリ使用量、スワップアクティビティ、IO待ち、エラーレートを継続的に追跡している。ログやAPMデータから負荷プロファイルを把握しているので、バックアップやバッチジョブ、トラフィックのピークを計ることができる。 空室状況 増加する。プロジェクトが成長すれば、プレッシャーが恒久的に高くなり、限界での最適化が症状を悪化させる前に、私は水平方向や垂直方向に規模を拡大する。.

コンテナとCグループ：メモリ制限とグローバルOOMからの保護

コンテナでは cgroup v2-ファイルバックアップページは読み取りプロセスのcgroupに割り当てられるので、常識的な制限としきい値を設定した。と メモリ.max 私は家出を防ぐ、, メモリ.high スロットルを早めに戻し、システムにクリーンアップの時間を与える、, メモリスワップ最大 単一のポッドがディスクに殺到しないように、スワップの使用量を制限しています。クリティカルなサービスは メモリ.low それぞれ メモリ.min, を使用することで、隣人がプッシュしてもキャッシュ共有が即座にクリアされることはない。PSIベースのメカニズム（systemd-oomdなど）と組み合わせることで、ホストがスラッシュする前にコンテナを狙った方法で終了させることができる。Kubernetesでは、リクエスト/リミットを現実的に選択し、カーネルが常にページキャッシュのためのスペースを確保できるようにノードのリザーブを計画することが重要です。.

立ち退きが現実の問題となった場合

立ち退きはその一部である。 通常運転, しかし、同一ファイルの頻繁なリロード、持続的なIOピーク、変動する応答時間などのシグナルは、スラッシングや不十分なキャッシュ保護を示している。Redis、JVMヒープ、DBプールの過剰利用はカーネルの息の根を止め、変位を加速させるからだ。バックアップやフルスキャンが大量のデータをシーケンシャルに読み込むと、ホットデータがキャッシュから押し出される。 ヒット率 のままだ。遠隔測定が繰り返しパターンを示す場合、私はカーネル・パラメーターを少しずつテストし、ライトバック・スムージングとメタデータ・キャッシュの保持時間を調整する。それでも十分でない場合は、RAMを増やしたり、ワークロードを分割したりします。常にプレッシャーをかけ続けることは、最終的には明確な容量決定よりもコストがかかるからです。.

まとめと次のステップ

私にとって最も重要なレバーは 理解する, 測定し、調整する。ワークロードのアクセスパターンを把握し、キャッシュのヒット率、IOウェイト、スワップの動きを測定し、キャッシュのサイズとカーネル・パラメータを調整して、立ち消えとライトバックがスムーズに実行できるようにする。仮想化環境では、次のようなメカニズムを維持している。メモリー・バルーンというのも、RAMの動的な割り当てはページキャッシュの範囲に影響するため、パフォーマンスを押し上げる可能性があるからだ。そして、変更を広く展開する前に負荷テストで成功を確認し、サプライズを回避して レイテンシー は一貫しています。このサイクルを定期的に維持することで、メモリへの圧力を管理しやすくし、ページキャッシュをスラッシングから守り、信頼性の高いレスポンスタイムを実現する。.