サーバーと仮想マシン

ディスクキュー長：サーバーパフォーマンスの最適化

の使い方を紹介しよう。 ディスクキュー長 ボトルネックを特定し、的を絞った方法でサーバーのパフォーマンスを最適化します。メトリックス、しきい値、具体的なチューニング手順を組み合わせて、以下のことを行います。 ストレージ遅延 そして、応答時間を著しく短縮する。.

中心点

定義ボトルネックの早期指標としてのI/O要求待ち
測定PerfMon、iostat、および補足的なレイテンシ・メトリクス
評価スピンドルごとのしきい値、読み取り/書き込みレイテンシ、利用率
最適化SSD/NVMe、RAID、RAM、クエリチューニング
練習ベースライン、アラーム、クリーン IO分析

ディスクキュー長とは何ですか？

仝 ディスクキュー長 は、ドライブに対して同時に待機している、または現在処理中の読み取りおよび書き込み操作の数を示します。スナップショットは、„Current “カウンタと „Average “期間値によって区別されます。 トレンド が見えるようになる。キューが増大すると、ワークロードがメモリーの処理能力を超え、待ち時間や応答時間の長さにつながる。複数のドライブやRAIDを持つシステム上では、その基礎となる スピンドル-数：スピンドルあたりのキューが小さくても致命的とはみなされない。最新のSSDやNVMeは、より多くの並列処理に対応することもできますが、リード/ライト時間の延長と組み合わされたキューの増加は、依然として明確な警告サインです。.

測定とモニタリング

を測定する。 キュー Windowsのパフォーマンス・モニターで、平均ディスク・キュー長、リード/ライト・キュー長、%ディスク時間、%アイドル時間、リード/ライトごとのレイテンシを記録する。Linuxでは、iostatや、nvme0n1などの個々のデバイスを記録し、1分間隔で分析するプラグインを使っている。 ヒント を表示します。アラームについては、持続的な負荷のピークを識別し、短いバーストではトリガーしないしきい値を選択します。同時に、キューが少ない状態で待ち時間が長い場合は、純粋なスループット不足ではなく、内部的な遅延を示すため、転送あたりの平均時間をモニターしています。もし、計測を終了したいのであれば、このトピックをさらに深く掘り下げてください。ディスク・スループットそして、観察されたキューとレイテンシーと比較する。.

綿密な測定方法とツール

確実な診断のために、私は標準的なカウンターだけでなく、もっと深く調べます。Windowsでは、Disk Reads/sec、Disk Writes/sec、Disk Transfers/secを追加し、一貫してデバイスとボリュームごとに分けている。現在のディスクキューの長さは、短いジャムを認識するのに役立ち、平均ディスク秒/読み込みと秒/書き込みは、知覚された待ち時間を直接定量化します。バーストのピークが平均値で消えないように、十分な解像度（1～5秒）で記録し、時系列をシステム内のイベント（デプロイ、バックアップ、バッチジョブ）と関連付ける。Linuxでは、iostat -xを使って、avgqu-sz（平均キューサイズ）、await（サービスを含む待ち時間）、%utilを追跡している。マルチキューを持つブロックデバイスの場合、%utilが高いからといって、必ずしも飽和しているわけではないことに注意。詳細な分析のために、私はblktrace/bpftraceを使用して、ホットスポットをリクエストレベルまで見えるようにし、fio（ブロックサイズ、キューの深さ、アプリケーションに応じたリード/ライトミックス）を介して現実的なパターンでテストします。重要なことに変わりはない：デバイス、ファイルシステム、アプリケーションの測定ポイントを組み合わせることで、原因と結果を明確に分けることができます。.

ストレージのレイテンシーを理解する

待ち行列の長さと増加 遅延時間 キューはバックログを表し、レイテンシーは操作ごとの遅延を表す。キューが高いままでレイテンシが増加すれば、目に見えて仕事がたまり、各操作に時間がかかり、リクエストが遅れることになる。 カスケード接続 が遅くなる。キューが少ないのにレイテンシが増加する場合は、ドライバー、ファームウェア、キャッシュ、ファイルレベルのホットスポットをチェックする。仮想化環境では、ストレージ・バックエンドのリード／ライト・レイテンシも監視する。ゲスト・システムのキューは、限られた範囲内でしか共有部分構造をマッピングしないことが多いからだ。ウェブやデータベースのワークロードでは、ディスクのレイテンシが高いと、ページのロード、APIのレスポンス、バッチの実行が長引きます。.

IO分析：ステップ・バイ・ステップ

私は毎回分析日次のパターン、バックアップ、cronjobsを視覚化するために、24時間のベースラインを使っています。その後、キュー・ピークと平均ディスク秒/読み込み、秒/書き込みの相関関係を調べ、原因と結果を区別し、実際のキュー・ピークを特定します。 連続負荷 短期的なピークから。SQLサーバーでは、PAGEIOLATCHなどの待ち時間を分析し、どのクエリーが読み込みや書き込みの時間を長くしているかをチェックします。そして、ハードウェアに取り組む前に、ホットファイル、ログの増加、インデックスの欠落、小さすぎるバッファプールを切り分けます。トラブルシューティングの背景については、こちらが参考になります： I/Oボトルネックの分析.

RAID、コントローラ、スピンドルの同等性

評価を意味のあるものに保つため、ワークロードを「スピンドル等価」に換算している。古典的なHDDアレイは、より多くの物理ディスクから恩恵を受ける。スピンドルあたりのキューが小さいのは正常で、スピンドルあたりの恒久的な値が1-2以上であればボトルネックであることを示している。RAIDレベルでは、書き込みペナルティに注意を払う。RAID-5/6は追加のI/Oでパリティを支払うため、同じキュー値でもRAID-10よりも早く飽和に至る。コントローラキャッシュ（BBWC/FBWC）は負荷のピークを滑らかにするが、短期的にはレイテンシの問題を隠すことができる。ここでは、ライトバックを安全に起動できるかどうか（UPS/バッテリー）と、ストライプサイズがファイルシステムクラスタと一致しているかどうかをチェックする。SSD/NVMeの場合、私はスピンドルではなく、並列キューとコントローラー・チャンネルを数えます。最新のNVMeドライブは何百もの同時リクエストを処理しますが、キューの増加とレイテンシの増大の組み合わせは、依然として私の主な警戒事項です。JBOD/HBAのセットアップは、ハードウェアRAIDとは異なる動作をします。したがって、測定結果を正しく分類するために、セットアップとキャッシュポリシーを文書化します。.

限界値と評価

については評価私は1つの数字に頼るのではなく、いくつかの重要な数字を組み合わせている。転送1回あたりの待ち時間が低く、ディスクのアイドル時間が長ければ、小から中程度の待ち行列は正常と考えられます。私は、中程度のキューにある値をより注意深く監視しています。特に、長期間にわたって持続している場合や、高い%ディスク時間を伴っている場合です。レイテンシが増加している永久的なバックログから、私は対策を計画し、ビジネスに直接影響するワークロードを優先します。重要であることに変わりはありません：私は、ドライブごと、ボリュームごと、そしてRAIDの場合はパラレル・ユニットの数に応じて、次のように評価します。比較フェアであることに変わりはない。.

仮想化とクラウドストレージ

VMでは、3つのレベルでミラーリングしている：ゲスト、ハイパーバイザー、ストレージバックエンドだ。バックエンドがすでにスロットリングしていたり、他のテナントがI/O時間を取っていたりすると、ゲストの低いキューは欺瞞になりうる。私はデータストアのレイテンシーとホストのキューをチェックし、カーネルの遅延とデバイスのレイテンシーを区別する。Hyper-V/VMware環境では、ストレージQoSを使って „ノイジー・ネイバー “を手なずけ、相関関係が明確になるようにゲスト内で並行して測定する。クラウドでは、ハードリミット（IOPS/MB/s）とバーストモデルを考慮する：帯域幅に達したり、バーストクレジットが空になったりすると、待ち行列が目に見えて減少する一方で、待ち時間が急激に増加することがよくあります。ネットワークベースのバックエンド（iSCSI、NFS、オブジェクトストレージ）は、さらにラウンドトリップを追加します。そのため、私はネットワークのジッターを分離し、MTU、パス、LACP/マルチパスをチェックします。クリティカルなワークロードに対しては、専用ボリュームと十分なヘッドルームを計画し、近隣の負荷がかかってもSLOが安定するようにする。.

低いキューに対する最適化戦略

私のアドレス原因まずワークロードとクエリをチェックし、次にキャッシュ、そしてハードウェアをチェックする。インデックス、より良いフィルター、選択的なクエリーは、I/Oを顕著に削減し、キューとレイテンシーを直接減少させる。RAMを増やせばページング・プレッシャーが減り、キャッシュのヒット率が上がる。ハードウェアのアップグレードでは、SSDやNVMeがオペレーションごとのレイテンシを大幅に低減します。ストライプセットを使ったRAIDレベルは負荷を分散し、並列性を高めます。キャパシティ・プランニングでは、ターゲットとなるワークロードを考慮し、以下のような計画を立てます。サーバー用IOPS ピーク負荷を推定する。.

オペレーティング・システムとドライバーのチューニング

ハードウェアを交換する前に、スタックのリザーブを増やします。Windowsでは、NVMe/Storportドライバのステータスをチェックし、「最大パフォーマンス」エネルギーモードを有効にし、レイテンシのピークを発生させるアグレッシブなPCIe省電力メカニズムを避ける。デバイスのライトキャッシュポリシーを意識的に選択します。UPS/コントローラーのバッテリー使用時のみライトバックを行い、許容可能なパフォーマンスで最大のデータセキュリティを得るためにはライトスルーを行います。また、複数のCPUコアがリクエストを並行して処理できるように、デバイスごとの割り込み分散とキューの深さも監視している。Linuxでは、SSD/NVMeに適したI/Oスケジューラーを設定し（プロファイルに応じてmq-deadline/kyber/none）、シーケンシャルなワークロード用にリードアヘッドを調整し、デバイスをスロットルしたりフラッディングしたりしないようにqueue_depth/nr_requestsを調整する。ダーティライトバックパラメータ（dirty_background_ratio/bytes、 dirty_ratio/bytes）は、バーストライトレイテンシがデバイスに到達する方法に影響する。私は、TRIM/Discardを時間制御ジョブとして計画し、本番負荷とメンテナンスI/Oが混在しないようにし、NVMeキューをCPUの近く（IRQアフィニティ、NUMA参照）にバインドして、コンテキストの変化を最小限に抑えます。.

評価で頻発するエラー

多くの管理者は キュー これは誤った結論を助長する。ワークロードのピークは短時間であり、他の方法で阻止できるにもかかわらず、コンテキストのない個々のピークは、性急なハードウェア購入につながる。さらに障害となるのは、過度に長い期間の集計にあり、これは厳しいピーク利用を引き起こす。変装. .仮想化セットアップでは、共有ストレージのバックエンドの影響を認識できず、ゲストのビューだけを評価する人がいる。私は、ベースラインを維持し、メトリクスを組み合わせ、相関関係をチェックし、変更を具体的にテストすることで、これを防いでいる。.

実践：ワードプレスとホスティングのワークロード

CMSサイトの場合、私はまず次のように分析する。 キャッシュ-というのも、ページとオブジェクトのキャッシュは読み込み負荷を劇的に減らすからだ。そして、書き込みのピークと読み取りアクセスが混在しないように、データベースとログファイルを別々のデータキャリアに分離しています。アップロードや画像処理が多いビジーなインスタンスでは、テンポラリファイルを高速SSDに移動します。バックアップとウイルススキャンは、プライマリI/Oの時間ウィンドウに入らないように、訪問者のピークの外にスケジュールしています。 待ち行列 ドライブを使用しています。マルチテナントホストでは、近隣に影響が出ないように、公正な制限と専用リソースに注意しています。.

ファイルシステム、ブロックサイズ、アライメント

私は適切なファイルシステムのチューニングによって、単純な利益を確保している。Windowsでは、大きなシーケンシャルI/Oが断片化されないように、データベースが多いボリュームには大きなアロケーション・ユニット・サイズ（64KBなど）を使うことが多い。Linuxでは、作業負荷に応じてXFSとext4のどちらを使うかを決めます。XFSは高い並列性のためにログバッファを追加するメリットがあり、ext4は適切に選択されたオプションと十分なジャーナルがメリットです。RAIDのストライプサイズとSSDのページが交差しないように、パーティションは常に1MiBアライメントにしています。不要なメタデータの書き込みを避けるため、relatime/noatimeで読み取り専用アクセスを緩和しています。LVM/MD-RAIDを使用する場合は、1回のI/Oで多くのストライプに触れないように、ストライプ幅とファイルシステムのブロックサイズを一致させるのが理想的です。私は、暗号化と圧縮を別々に評価します。これらはCPU負荷を増加させ、I/Oパターンを変化させ、したがってドライブのレイテンシを変化させます。.

主要数値の表と解釈

私はクリアを使っている。 ガードレール を使用して迅速に評価し、すべてのサーバーで一貫性を保つことができます。次の表は、私がモニタリングで優先する一般的なメトリクスの賢明な目標範囲を示しています。重要：私は、誤った判断を避けるために、これらの値を単独ではなく、常に一緒に評価します。逸脱があった場合は、ランタイムパターン、ワークロードイベント、設定変更をチェックしてから介入します。こうすることで、私は行動する能力を維持することができる。 最適化 的な方法で。.

指標	目標値	観察する	アラーム
平均ディスクキュー長	紡錘の数に比べて小さい	長持ちする	永続的なバックログ
平均ディスク読み取り秒数	< 10 ms	10-20ミリ秒	> 20 ms
平均ディスク秒/書き込み	< 10 ms	10-20ミリ秒	> 20 ms
%ディスクタイム	< 80 %	80-90 %	> 90 %
% アイドルタイム	> 20 %	10-20 %	< 10 %

リトルの法則によるキャパシティ・プランニング

信頼性の高いヘッドルームの決定のために、私は実際にはリトルの法則を使っている：同時I/O数≒IOPS×平均レイテンシ。これにより、キューの長さとレイテンシを一緒に読まなければならない理由が明確になります。例：あるボリュームが5,000 IOPSを1オペレーションあたり4 msで安定的に提供する場合、平均して約20オペレーションが同時に進行していることになる。バックエンドが追いついていない状態で需要が10,000 IOPSに増加した場合、同時リクエスト数が増加し、キューが増加し、レイテンシが発生します。私は、観測されたピーク負荷に対して30～50個の%バッファを計画し、SLOを単なる平均値としてではなく、p95/p99のレイテンシターゲットとして定義します。私は、システムのI/Oカーブを測定するために、特に合成テスト（fio）を使用している：ブロックサイズ、キューの深さ、リード／ライトの割合を変化させ、レイテンシが不均衡に増加するキューの深さを記録する。過去のベースラインと組み合わせることで、ワークロード・チューニングで十分なのか、メモリの帯域幅／IOPSを増やす必要があるのか、根拠のある判断ができる。.

モニタリングの設定：簡単なチェックリスト

最初に一貫性を持たせたのは カウンター 比較の信頼性が保たれるように、全ホスト上で。そして、持続的な問題を検出し、短いバーストを無視するエスカレーション付きのアラーム・ルールを定義します。トレンドと季節性を認識するのに十分な期間、時系列を保存し、システムに対する大きな変更を直接モニタリングに記録します。データベースについては、待機統計、クエリのトップリスト、ログの増加を追加して、クエリレベルで直接I/Oホットスポットを確認します。定期的なレビューによって、しきい値は常に最新の状態に保たれます。 バウンダリー 意味のあるアラーム.

要約：私が得たもの

仝 ディスク キューの長さは、メモリが限界に達し、ユーザーが顕著な遅延を経験するようになると、早い段階で私に示します。私の評価は、読み取り/書き込みレイテンシ、%ディスク時間、アイドル共有と組み合わせて初めて本当に信頼できるものになります。私は、SSD/NVMeやRAID戦略によってハードウェア側に取り組む前に、ワークロードのチューニングやキャッシングによってボトルネックを解決することを好む。ベースライン、クリーンアラーム、定期的なレビューにより、進捗を確認し、再発を防止する。これらの原則を一貫して適用すれば、次のようなことが削減できる。 レイテンシー, キューをフラットに保ち、負荷がかかっても安定した応答時間を実現します。.