オートスケール
最終更新日 2025年02月27日(木)
Table of Contents
Heroku のネイティブのオートスケール機能を使用すると、アプリケーションの 1 つ以上のパフォーマンス特性に基づいて、Web dyno の数量を自動的にスケーリングできます。
オートスケールは、Performance 層、Private 層、Shield 層の dyno でのみ利用できます。オートスケールは、応答時間のばらつきを大幅に抑えるために、アプリケーションに依存します。これがユーザーのニーズを満たさない場合や、アプリに対して想定どおりに機能していない場合は、Elements Marketplace にあるサードパーティ製のアドオンを検討してください。オートスケールは、Fir 世代のアプリではまだ利用できません。
設定
この機能は、アプリの Heroku Dashboard の Resources
(リソース) タブで設定できます。
設定オプションにアクセスするには、Web dyno の詳細の横にある
Enable Autoscaling
(オートスケールを有効化) をクリックします。スライダーまたはテキストボックスを使用して、アプリでオートスケーリングする dyno の最小と最大の許容数を指定します。dyno 数の下限を 1 未満にすることはできません。dyno 範囲を調整すると、関連するコストが変化します。
次に、アプリの
Desired p95 Response Time
(望ましい p95 応答時間) を設定します。オートスケールエンジンはこの値を使用して、dyno の数をスケーリングする方法を決定します。Web dyno 数が範囲の上限に達したときにアプリのコラボレータとチームメンバーに通知するには、
Email Notifications
(メール通知) を有効にします。通知用メールは 1 日に最大 1 件送信されます。
設定後、Confirm
(確認) をクリックします。現在の dyno の数は範囲に合わせてすぐに調整されます。
オートスケールロジック
Dyno Manager はアプリの Desired p95 Response Time
(望ましい p95 応答時間) を使用して、アプリのスケーリングを行うタイミングを決定します。このアルゴリズムによって、過去の時間からのデータが使用され、現在のリクエストスループットでの受信リクエストの 95% についての望ましい応答時間を実現するために必要な Web dyno の最低数が計算されます。計算に WebSocket トラフィックは含まれません。
オートスケールイベントが発生するたびに、1 つの Web dyno がアプリに追加されるか、アプリから削除されます。オートスケールイベントは、必ず 1 分以上の間隔を空けて発生します。
このアルゴリズムでは、スケールダウンはスケールアップよりも消極的に行われます。この段階的なスケールダウンにより、リクエストの一時的な停滞から大幅なスケールダウンが行われることによって、需要がその後急増した場合にレイテンシーが高くなることを回避できます。
アプリで 3 分間リクエストのスループットがない場合、スループットが再開されるまで、Web dyno は 1 分間隔でスケールダウンします。
場合によっては Web リソースではなく、ダウンストリームのボトルネックによってリクエストが遅くなることがあります。このような場合、Web dyno の数をスケールアップしても、レイテンシーへの影響が最小限になる可能性があります (マイナスの影響が生じる可能性すらあります)。これらのシナリオに対応するため、失敗したリクエストの割合が 20% 以上になるとオートスケールは無効になります。しきい値アラートを使用して、失敗したリクエストに関する指標を監視できます。
オートスケールイベントの監視
Heroku Dashboard での操作
オートスケールイベントは、Heroku Dashboard の Events chart
(イベントグラフ) に手動のスケーリングイベントと共に表示されます。イベントの詳細では、Dyno Autoscaling
で特定されます。さらに、オートスケールの有効化、無効化、変更も表示されます。
一定の間隔内にオートスケールイベントが複数回実行される場合、スケーリングの方向が変わったステップのみが表示されます。たとえば、Scaled up to 2 of Performance-M
の下の Events グラフには 3 つの Performance-M dynos のピークまでの中間ステップがありますが、これは表示されません。
Webhook の使用
アプリの Dyno formation が変更されるたびに送信される Webhook 通知を登録できます。Dyno formation に関連する Webhook 通知は api:formation
タイプです。
Webhook 通知の登録についての詳細は、「アプリの Webhook」を参照してください。
オートスケールの無効化
アプリの Resources
(リソース) タブで Disable Autoscaling
(オートスケールの無効化) ボタンをクリックして、オートスケールを無効化します。その後、確定した Web dyno の数を指定して Confirm
(確認) をクリックします。
CLI から手動でスケーリングするか、API から ps:scale
に対する呼び出しを行い、(たとえばサードパーティ製オートスケールツールを使用して) 手動でスケーリングして、オートスケールが無効になるように指示します。
既知の問題と制限事項
オートスケール機能全般に言えることですが、特定のアプリケーションのヘルスシナリオではオートスケールは向いていません。Postgres 接続プール、ワーカーの数、またはアドオンプランを調整して、Web Dyno formation に変更を適応させる必要がある場合もあります。20% 以上のリクエストスループットエラー率に基づくスロットルのオートスケールのメカニズムは、ダウンストリームコンポーネントでボトルネックが発生したシナリオ向けに作られています。詳細は、スケーリングに関する考慮事項についてを参照してください。
負荷テストで本番稼働をシミュレーションし、オートスケールと同時にしきい値アラートを使用してアプリのエンドユーザーエクスペリエンスを監視することを強くお勧めします。Heroku Support の通知要件については、「負荷テストのガイドライン」を参照してください。
Heroku の Web オートスケールを HireFire などのサードパーティ製の Worker オートスケール機能と同時に使用すると、まれに競合状態が発生することが確認されています。この競合状態により、Heroku のオートスケールが予期せず無効になります。このシナリオを回避するため、これら 2 つのオートスケールツールは同時に使用しないでください。
オートスケールは Fir 層の dyno ではまだサポートされていません。「Heroku 世代」で Fir についての詳細を読んで進行状況を追跡するか、Changelog の受信登録を行ってください。
スケーリングの制限
dyno タイプによって、スケーリングできる限度が異なります。スケーリングの制限については、「dyno のスケーリングとプロセスの制限」を参照してください。