サーバーと仮想マシン

サーバーのディスクスループット：実際のホスティングパフォーマンスを最大化

ディスクスループットサーバーは、ストレージシステムが1秒間に実際に転送するデータ量と、ショップ、データベース、アナリティクスのクエリの応答速度を決定します。実際のホスティング・パフォーマンスで重要なこと スループット, レイテンシー, IOPSと実負荷下での相互作用。.

中心点

IOPS そして レイテンシー rawのMB/sよりもレスポンスタイムに影響する。.
NVMe ビーツ SATA データベースとアナリティクスの分野で大きな成果を上げている。.
TTFB そして LCP ストレージのパフォーマンスをSEO効果につなげる.
fio-実際のブロックサイズを使ったテストが真実を示している。.
品質保証 防ぐ Noisy 共有ホストのネイバー効果。.

ディスクのスループットとは実際どのようなものなのか？

分かっている スループット IOPSが小さなランダムアクセスを表すのに対して、大きなファイルを動かすシーケンシャルデータレートとして使われる。どちらの指標も、最初の応答までの時間に顕著な影響を与える。ショップは商品画像をシーケンシャルにロードするが、ショッピングバスケットは多くの小さなデータレコードをランダムに書き込む。このことからわかるように高速なスループットはバックアップやメディア・ルートに役立ち、高いIOPSはセッションやクエリの待ち時間を短縮します。したがって、私は両方の値を混合負荷の下で測定します。 パフォーマンス 日常業務において。.

IOPS、レイテンシ、スループットを正しく読み取る

低い レイテンシー システムが最初のバイトでより速く応答するため、顕著な応答性が得られます。NVMe SSDは、しばしばここでコンマ1ミリ秒を実現しますが、HDDはかなり遅くなります。多くのマーケティング値は、日常生活ではほとんど発生しないシーケンシャルな理想条件を示しています。私は、95パーセンタイルと99パーセンタイル、4～32KBのブロックサイズ、現実的な読み取り/書き込み比率に注目しています。ボトルネックに深く踏み込む人は、十分な根拠のある遅延分析, 恒久的なピークを認識し TTFB を下げる。

ストレージ・クラスの比較

HDD、SATA SSD、NVMe SSDは、それぞれ非常に異なるプロファイルと予算に対応している。古典的なハードディスクはIOPSが低く、小さなアクセスへの反応が著しく鈍い。SATA SSDは、IOPSを増加させ、レイテンシを明らかに減少させ、コンテンツ管理やシンプルなVMに適しています。NVMeは、非常に高いIOPS、最小限のレイテンシ、そして分析、VDI、大規模データベース向けの高いGB/秒を備えており、トップに位置しています。概要が必要な場合は、主要な数値を比較してください。 ブロックサイズ そして アクセスパターン 一目瞭然。

保管クラス	ランダムIOPS（代表値）	レイテンシー（代表値）	スループット（代表値）	用途
HDD 7.2k	80-150	5-10 ms	150-220 MB/秒	アーカイブ、コールドデータ
SATA SSD	2万～10万ドル	0.08-0.2 ms	500～550MB/秒	ウェブ、CMS、VM（ベイシス）
NVMe SSD	15万～1000万円以上	0.02-0.08 ms	2-7 GB/秒	データベース、アナリティクス、VDI

RAIDとファイルシステム：乗算器かブレーキか

適切な RAID はIOPSとスループットを増大させるが、正しくないレベルでは書き込み性能が低下する。RAID10はランダムな書き込み負荷で得をすることが多いが、RAID5はパリティ作業により集中的な書き込みを遅くする。ファイルシステムとそのスケジューラーも、キューの深さと優先順位を決定する。私はベンチマークを分析する前に、ライトバックキャッシュ、ストライプサイズ、アライメントをチェックする。こうして物理的な ハードウェア ソフトウェア側にボトルネックを作る代わりに。.

OSとファイルシステムのチューニング：小さなスイッチで大きな効果

ハードウェアをアップグレードする前に、私は以下の方法で蓄えを節約している。 マウントオプション とファイルシステムを選択します。ext4では、メタデータのオーバーヘッドを ノー・タイム／リラ・タイム とフィット コミット-インターバルをリカバリ要件に合わせる。XFSは並列化によってうまくスケールする。 ログサイズ そして アロケサイズ をストライプに追加します。ZFSはチェックサム、キャッシュ（ARC）、スナップショットで説得力がある。 レコードサイズ ワークロードに適したもの（例えば、OLTPでは16～32KB、メディアでは128KB）。. リード・アヘッド (例えば128-512KB)はシーケンシャルストリームを加速させるが、ランダムヘビーなデータベースでは保守的なままだ。. トリム／ストリム 私は永久的にではなく、定期的に計画している。破棄, レイテンシのピークを避けるため。重要：ストライプとブロックのアライメントが正確でなければ、IOPSを与え、書き込み増幅を増加させる。.

キューの深さ、スケジューラ、CPU割り当て

仝 キューの深さ (QD）は、SSDが利用されるか減速されるかを決定します。NVMeは混在負荷に対してQD 16-64を好みますが、ウェブ・ワークロードでは安定したレイテンシを得るためにQDを低くした方が有利なことがよくあります。テスト mq-デッドライン そしてなしをNVMeのI/Oスケジューラとして使用する。 bfq 共有ホストに公平性をもたらすマルチ・キュー・ブロックIOはCPU間でスケールする。 IRQ コア（およびNUMAノード）上のNVMeキューを、どのコアもボトルネックにならないようにします。クリーンな CPUとの親和性 ウェブサーバー、データベース、ストレージの IRQ 間では、コンテキストスイッチとクロス NUMA アクセスが減少するため、レイテンシが平滑化され、TTFB が低下します。.

ワークロードプロファイルウェブ、ショップ、データベース

CMSは多くの小さなファイルを読み込むので、次のような利点があります。 IOPS とキャッシング。ショップでは、（シーケンシャルな）イメージと（ランダムな）オーダーテーブルやセッションテーブルが組み合わされており、これがNVMeがチェックアウト時間を大幅に短縮する理由です。データベースの場合、低レイテンシと、負荷が混在する状況下での安定した書き込みパフォーマンスが期待できます。データ集約的なアプリケーションを実行するのであれば、NVMeで始めるのが理にかなっています。アプリケーション用IOPS とヘッドルームの計画を立てる。これにより スケーリング トラフィックのピークに強い。.

測定方法：fio、ioping、TTFB

でテストしている。 fio 現実的なブロックサイズ、キューの深さ、数分間にわたるリード/ライトの混在。Iopingはレイテンシの変動を示し、キャッシュの限界や熱の限界をしばしば明らかにします。同時に、TTFBもモニターしている。800ミリ秒以下はまずまず、180ミリ秒以下は優秀、1.8秒以上は憂慮すべき値です。合成テストとアプリケーション・ベースのテストを組み合わせることで、TTFBを明確に把握することができます。 パフォーマンス 日常生活の中で。

ベンチマークの落とし穴：望ましい値ではなくクリーンなテスト設計

私はターゲットに応じて、意図的にキャッシュを温めたり空にしたりしている。コールド測定はファーストヒット時の挙動を示し、ウォーム測定は負荷時の現実を示す。私は温度サーマルスロットリングは避けてください。ベンチマークは、cronもバックアップも使わずに排他的に実行します。ログを取る 95/99パーセンタイル, CPUの使用率、割り込み負荷、コンテキストスイッチ。その データセット ストレージをテストしたい場合はRAMを上回りますが、そうでない場合はキャッシュだけを測定します。私はテスト時間（少なくとも3～5分）と ブロックサイズ, SLCキャッシュを公開する。私はプロファイルが再現可能な場合のみシステムを比較する。そうでなければ、リンゴとオレンジを比較することになる。.

キャッシュ、CDN、データベースのチューニング

賢い キャッシュ ホットデータをRAMに保持することで、IOPSを減らすことができる。私はオブジェクトキャッシュ、OpCache、エッジキャッシングを使い、ストレージの起動頻度を下げている。CDNは画像や静的アセットの負荷を軽減し、ソースでのスループットを解放する。データベースでは、インデックス、トランザクションの短縮、書き込みのバッチ化によってレイテンシを減らしている。これらを組み合わせることで、LCPやINPのようなウェブの中核となる要素に貢献し、ウェブ・システムを強化することができる。 ＳＥＯ 目につく。

ノイズの多い隣人に対するQoS

共有ホストでは、私は公正を保証する 入出力-個々のプロジェクトがすべてをブロックしないようにする。サービス品質はバーストを制限し、リソースを予測可能に分配する。つまり、ピークが発生してもレスポンスタイムは安定している。私は、生産性の高いシステムを移行する前に、プロバイダーが明確な制限と監視を行っているかどうかをチェックします。これにより、99パーセンタイルの異常値を減らし 計画性 はっきりと。

容量、耐久性、SLCキャッシュ

多くのSSDは SLC-キャッシュは、短時間に高い書き込み速度を示し、その後低下する。そのため、継続的な負荷の下では、ピーク値だけでなく、持続的な書き込み性能を評価する。大容量になればなるほど、コントローラーのチャンネル数が増えるため、IOPSも増えることが多い。私は、年間コスト計算に耐久性（TBW/DWPD）を含めています。このようにして、私は、以下の条件を満たすドライブを選びます。 ワークロード 永久に着用する。.

PLPとデータの一貫性：書き込み性能を正しく確保する

書き込み速度が高くても、停電でデータに一貫性がなくなったら意味がない。私は 電力損失保護（PLP） とクリーンなフラッシュ/FUAセマンティクスを提供します。PLPを備えたエンタープライズSSDは、メタデータの一貫性を維持し、データベースへのリスクなしに、より積極的なライトバックキャッシングを可能にします。PLPがない場合、私はクリティカルなサービスに、より保守的な同期ポリシーを強制的に採用させます。 耐久性. .ジャーナルファイルシステムは、そのバランスが重要です。 fsync-ポイントと、確実にコミットできるコントローラキャッシュがある。これにより、整合性を犠牲にすることなく、レイテンシとTTFBを安定に保つことができる。.

主要数値の解釈：95パーセンタイルと99パーセンタイル

ヒント パーセンタイル は、ユーザーが実際に嫌な思いをする頻度を明らかにする。平均値が低くても、99パーセンタイルが高ければあまり意味がない。私は、ストレージ、CPU、ネットワーク間の値が不均衡にならないように等しくしている。そうしないと、リンゴとオレンジを比較することになるからだ。ワークロードごとに明確な目標値を設定することで、投資の方向性を決定します。効果が最大である。.

仮想化とコンテナ：レイテンシーを犠牲にするレイヤー

時点では KVM 私はvirtio-blk/virtio-scsiまたはNVMeエミュレーションを使用し、PLPに応じてキャッシュモード（ライトバック、なし）を意識的に選択しています。ゲストとホストのI/Oを並行して測定し、オーバーヘッドを可視化します。. シン・プロビジョニング そのため、フィル・レベルとフラグメンテーションを監視している。コンテナでは、レイヤーのファイルシステム(オーバーレイ2)にホットデータを保存する。 バインドマウント コピー・オン・ライトのコストを節約する。エフェメラル・ボリュームはキャッシュに、パーシステント・ボリュームはデータベースに適しており、バックアップとリストアを計画できるようにきれいに分離されています。これにより、追加の抽象化が高速NVMeの利点を食いつぶしてしまうのを防ぎます。.

ネットワークストレージ：iSCSI、NFS、Cephを正しく分類する

共有と 分散ストレージ-ソリューションは柔軟性をもたらすが、レイテンシがかかる。NFSの場合は、マウント・オプション、rsize/wsizeを最適化し、セッション・ハンドリングのあるNFSv4.1+を選択します。iSCSIの場合 マルチパス 帯域幅を束ね、フェイルオーバーを確実にするために必須です。私はMTU、フロー制御、専用ストレージファブリックに注意を払っています。Ceph/clusterは水平にスケールするが、小さなランダムIOがネットワークホップを直撃する - 私はSSDジャーナル/DBデバイスを使用し、99パーセンタイルを特に厳密に測定する。ネットワークが一貫して低レイテンシで提供される場合にのみ、バックエンドのスループットは高速なTTFBとLCPに変換されます。.

WordPressのセットアップ：プラグイン、メディア、オブジェクトキャッシュ

多くの プラグイン クエリーやファイルアクセスが増えるので、IOPSが減る。プラグインを最小限にし、オブジェクトキャッシュを使い、cronジョブを調整する。サーバー側でメディアを最適化し、ストレージを通過するバイト数を減らす。NVMeでは、特に並列性が高い場合、ロード時間が顕著に短縮されることが多い。適切なストレージクラスを選択するために、私は NVMeホスティングの比較そして、私の成長に合わせてセットアップを調整する。 ローディング時間 は安定している。

バックアップ/リストアウィンドウとスナップショット

バックアップは純粋なI/Oであり、ユーザーと競合する。私は次のように考えている。 バックアップ・ウィンドウ ピーク時以外では、QoSでスループットを調整し、インクリメンタルランを使用する。. スナップ写真 (LVM/ZFS)バックアップの実行を本番の負荷から切り離し、コピー・オン・ライトのオーバーヘッドを最小にするため、バックアップの実行は短くする必要があります。リストアは真の指標である。私は定期的にリストアをテストし、実際のリストア時間を測定している。 RTO/RPO. .リストア帯域幅とランダムリードIOPSに注意を払わないと、緊急時に長いダウンタイムが発生し、TTFB/SEOの優位性を再び失うことになる。.

連続運転中のモニタリングとアラーム

好業績の持続が必要 テレメトリー. .私はレイテンシ、IOPS、キューの長さ、温度、SSDを監視しています。スマート-値。. サーマルスロットリング エアフローを増やすか、他のベイを使用することで、定期的に低下することを認識しています。TTFBとストレージメトリクスを関連付け、最適化が本当にユーザーに届いていることを証明します。アラートは平均値ではなく、95/99パーセンタイルに設定しています。一定のダッシュボードと同一の測定設定により、比較は公正に保たれ、投資は的を射たものになり コアウェブ・バイタル 安定している。.

要するに、これが私がホスティングのパフォーマンスを最大化する方法である。

私の評価 ワークロード, 適切なストレージクラスを選択し、理想的な値ではなく現実的なプロファイルでテストします。そして、TTFBと99パーセンタイルが目に見えて下がるまで、RAID、ファイルシステム、キャッシュをチューニングする。限界値で監視することで効果を永続的に維持し、QoSで異常値を減衰させる。成長中のプロジェクトでは、ヘッドルームを計画し、より高速なメディアにデータレコードを移動させます。こうすることで、高いディスク・スループットが、高速なリアクション、より優れたコア・ウェブ・バイタル、より高いパフォーマンスの代償となる。 コンバージョン にある。