examhub .cc 用最有效率的方法,考取最有價值的認證
Vol. I
本篇導覽 約 28 分鐘

成本最佳化儲存解決方案

5,450 字 · 約 28 分鐘閱讀

成本最佳化儲存是 AWS 帳單中投資報酬率最高的一把槓桿。典型企業 AWS 帳戶有 15–30% 的總費用花在儲存服務上——Amazon S3 儲存桶、Amazon EBS 磁碟區、Amazon EFS 檔案系統、快照與 AWS Backup 保存庫。SAA-C03 領域 4 任務 4.1「設計成本最佳化儲存解決方案」考驗你能否將工作負載對應到最便宜的持久儲存層、選對 S3 生命週期轉換策略、讀懂 Storage Lens 儀表板,並避免「把冷資料永遠放在 S3 Standard 上」這個拉高真實帳單的經典錯誤。

本學習筆記涵蓋 SAA-C03 成本最佳化儲存的完整範圍:S3 儲存類別成本階梯、S3 生命週期政策(轉換與到期)、S3 Intelligent-Tiering 深度解析、S3 Storage Lens 全帳戶可視性、EBS 成本(gp3 vs gp2、快照儲存、快照封存)、EFS-IA 生命週期、Storage Gateway 成本模式,以及 Glacier 保存庫政策。所有內容都以成本情境為錨點——封存、災難復原、冷資料——讓你看到「某公司需要保存合規日誌十年、每年擷取不超過一次」這類考題時,馬上能用成本最佳化儲存的思維在幾秒內找到答案。

什麼是 AWS 成本最佳化儲存

成本最佳化儲存是一種實踐:將 AWS 中儲存的每一位元組,對應到在符合工作負載耐久性、可用性、延遲與擷取 SLA 前提下最便宜的服務與層級。成本最佳化儲存不等於「永遠選 Glacier Deep Archive」——它是一個工程決策,需要在每 GB 儲存費用、每次請求費用、擷取費用、最低儲存天數與監控成本之間,衡量存取模式後做出取捨。

SAA-C03 成本最佳化儲存必須掌握的五大槓桿:

  1. 儲存層選擇 — 從第一天就挑選正確的 S3 儲存類別或 EBS 磁碟區類型。
  2. 生命週期自動化 — 讓 S3 生命週期政策或 EFS 生命週期管理自動將資料移至更冷的層級。
  3. 可視性 — 使用 S3 Storage Lens 與 AWS Cost Explorer 找出成本最佳化儲存設定中的浪費。
  4. 右型化 — 消除過度佈建的 Amazon EBS 磁碟區、未使用的快照與廢棄儲存桶。
  5. 傳輸與擷取經濟學 — 在單一區域的成本最佳化儲存就足夠時,避免跨區域複寫;並批次執行 Glacier 擷取以攤薄費用。

每一道 SAA-C03 成本最佳化儲存題目都是這五個槓桿的變形。若你能點名情境所對應的槓桿,幾乎都能從四個選項中挑出正確答案。

成本最佳化儲存是一門學問,目標是將每個資料集配對到仍能滿足所需耐久性、可用性與擷取時間 SLA 的最低成本 AWS 儲存層。目標不是最低單價,而是包含擷取、請求與營運成本的最低總成本。成本最佳化儲存設計從存取模式出發,而非從儲存類別出發。

白話文解釋 Cost-Optimized Storage

用三個生活化的類比來說明成本最佳化儲存,選一個最容易記住的。

類比一:便利商店進貨策略(成本最佳化儲存 = 食材分層管理)

把 AWS 的成本最佳化儲存想像成一間便利商店的進貨策略。今天就要上架的鮮食放在收銀台旁的冷藏櫃——取用即時,但空間昂貴(S3 Standard 和 EBS gp3 就是這個位置)。本週會賣的飲料放在店內冷藏區——仍然快速,略微便宜,但你要多走幾步拿(S3 Standard-IA)。大批量的米糧和冷凍品放在地下倉庫——每公斤存放成本極低,但要幾分鐘才能拿上來解凍(S3 Glacier Flexible Retrieval)。七年份的防災備糧鎖在最深處的封存倉——每公斤最便宜,但光是走到那裡、開鎖、搬上來就要好幾個小時(S3 Glacier Deep Archive)。

精明的店長不會把七年份的米放在收銀台旁。精明的架構師不會把七年份的合規日誌放在 S3 Standard 上。成本最佳化儲存就是這回事:每樣東西該放在哪一層,以及誰負責隨著時間自動把食材從收銀台移到倉庫(S3 生命週期政策)。

類比二:自助倉儲(成本最佳化儲存 = 分層置物格)

想像一棟三層樓的自助倉儲中心。一樓靠近入口的置物格最貴——每月 100 元,但你走進去 30 秒就能拿到東西(S3 Standard)。二樓置物格每月 50 元,但每次取件要另付 5 元手續費(S3 Standard-IA 和 One Zone-IA)。地下室的「深度封存庫」每月只要 3 元,但你必須填表申請,等工作人員 12–48 小時後把箱子搬上來(S3 Glacier Deep Archive)。成本最佳化儲存要問的是:以你實際開箱的頻率來算,哪一層 12 個月下來最便宜?每天開,一樓最划算。五年才開兩次,地下室勝出,就算加上取件費也差很多。生命週期政策就是那個會自動把長期沒動的箱子往下移的倉管員。

類比三:郵寄服務(成本最佳化儲存 = 選擇運送等級)

寄包裹時,隔日快遞很貴但即時送達(S3 Standard、EBS io2);陸運便宜,三天到(S3 Standard-IA、EBS gp3);經濟貨運超便宜,但要等幾週,而且急件要加收手續費(S3 Glacier、EBS snapshot archive)。聰明的物流主管依收件人實際需要包裹的時間選擇運送等級——而不是「一律隔日快遞,因為我負擔得起」。成本最佳化儲存就是為每一個位元組選對運送等級:這份資料多快會被讀回?然後用規則把選擇自動化,這樣就不用人工一件件挑等級。

三個類比的共同結論:成本最佳化儲存的決策本質上是存取模式的決策。先搞清楚讀取頻率與擷取緊迫性,儲存類別自然就選出來了。

S3 儲存類別成本階梯 — 成本最佳化儲存的核心

Amazon S3 有七個主要儲存類別,各有不同的成本結構。在 SAA-C03 的成本最佳化儲存考題中,你必須不只知道名稱,還要了解成本模型:每 GB-月的儲存費、每次請求費、擷取費、最低儲存天數,以及最低物件大小。

S3 儲存類別 — 成本比較表

儲存類別 儲存費 $/GB-月(約,us-east-1) 擷取費 最低儲存天數 最低物件大小 首位元組延遲
S3 Standard $0.023 毫秒
S3 Intelligent-Tiering $0.023(Frequent)→ $0.00099(Deep Archive) 無(但監控費 $0.0025/1000 物件) 毫秒–12 小時
S3 Standard-IA $0.0125 $0.01/GB 擷取費 30 天 128 KB 毫秒
S3 One Zone-IA $0.01 $0.01/GB 擷取費 30 天 128 KB 毫秒
S3 Glacier Instant Retrieval $0.004 $0.03/GB 擷取費 90 天 128 KB 毫秒
S3 Glacier Flexible Retrieval $0.0036 $0.01/GB(Standard)+ 每次請求費 90 天 40 KB 1 分鐘–12 小時
S3 Glacier Deep Archive $0.00099 $0.02/GB(Standard)+ 每次請求費 180 天 40 KB 12–48 小時

數字會因區域與時間而異,但比例比絕對值更重要。S3 Glacier Deep Archive 每 GB-月的費用約是 S3 Standard 的 1/23。這就是為什麼成本最佳化儲存設計永遠要問:這份資料能否接受 12 小時的擷取等待,以換取超過 95% 的儲存費折扣?

S3 成本最佳化儲存決策樹

  1. 每天存取 → S3 Standard。熱資料不要付擷取費。
  2. 存取模式不明或變動中 → S3 Intelligent-Tiering。付少量監控費,讓 AWS 自動移動。
  3. 每月存取,需要毫秒延遲 → S3 Standard-IA。
  4. 每月存取,可容忍 AZ 遺失(可重建資料) → S3 One Zone-IA。比 Standard-IA 便宜約 20%。
  5. 每季存取,需要毫秒延遲 → S3 Glacier Instant Retrieval。
  6. 一年幾次存取,可接受分鐘至小時的擷取 → S3 Glacier Flexible Retrieval。
  7. 7–10 年中只存取一兩次(合規封存) → S3 Glacier Deep Archive。
S3 Standard-IA 和 One Zone-IA 都會收取擷取費(約 $0.01/GB),且有 30 天的最低儲存天數。若你將物件放入 S3 Standard-IA 後 10 天就刪除,仍會被收取 30 天的費用。這是成本最佳化儲存在實際存取模式比預期更熱時常見的隱藏成本。轉換前務必確認最低保留天數。

S3 儲存類別成本損益平衡計算

成本最佳化儲存不是自動就能節費的——分類錯誤的物件放在「較便宜」的層級反而可能花更多。以每月存取一次的 1 GB 物件為例:

  • S3 Standard:$0.023/月儲存費,小型 GET 擷取費約 $0 → 共約 $0.023
  • S3 Standard-IA:$0.0125/月儲存費 + $0.01 擷取費 → 共約 $0.0225
  • S3 Glacier Instant:$0.004/月儲存費 + $0.03 擷取費 → 共約 $0.034

每月存取時,Standard-IA 與 Standard 相當,Glacier Instant 反而更貴。成本最佳化儲存意味著 Standard-IA 要在每月存取少於一次時才划算,Glacier Instant 要在每季存取少於一次時才划算。熟記這些損益平衡的存取頻率——SAA-C03 情境題直接用這些數字出題。

S3 生命週期政策 — 成本最佳化儲存的自動化層

S3 生命週期政策是成本最佳化儲存的自動化機制。儲存桶上的生命週期設定包含若干規則,定義了:

  • 轉換動作 — 在建立後(或 S3 Intelligent-Tiering 的最後存取後)N 天,將物件移至更冷的儲存類別。
  • 到期動作 — 在 N 天後永久刪除物件。
  • 非當前版本轉換/到期 — 處理版本控制儲存桶中的舊版本物件。
  • 中斷多部分上傳清理 — N 天後刪除廢棄的多部分上傳(光這一條就能節省可觀費用)。
  • 篩選器 — 將規則範圍限縮在特定前綴、標籤或物件大小區間。

典型的成本最佳化儲存生命週期鏈

合規日誌的生產級成本最佳化儲存生命週期通常長這樣:

第 0 天    → S3 Standard                    (主動調查中,熱讀取)
第 30 天   → S3 Standard-IA                 (偶爾查詢)
第 90 天   → S3 Glacier Instant Retrieval   (罕見存取,需毫秒擷取)
第 365 天  → S3 Glacier Flexible Retrieval  (僅供稽核,可等數小時)
第 730 天  → S3 Glacier Deep Archive        (法規封存)
第 2555 天 → Expire(刪除)                 (滿足 7 年保留期)

一個每月吞吐 1 TB 的工作負載透過這條生命週期鏈,7 年下來的費用比全留在 S3 Standard 大約便宜 85%。這是 AWS 上成本最佳化儲存能帶來的最大單一節費效益。

撰寫 S3 生命週期規則時,務必加一條「7 天後中止未完成多部分上傳」的規則。失敗或廢棄的多部分上傳會無聲無息地累積,可能悄悄消耗數 TB。這是零成本實施的免費成本最佳化儲存改善,而且出現在每一份 AWS 成本最佳化審查報告中。

生命週期轉換規則與限制

成本最佳化儲存的生命週期轉換有特定允許方向。你可以從較熱的類別轉換到較冷的類別,但不能透過生命週期反向轉換(需要先還原再複製)。關鍵規則:

  • S3 Standard → 任何較冷的類別,均允許。
  • S3 Intelligent-Tiering → S3 Glacier Flexible / Deep Archive,允許。
  • S3 Standard-IA → S3 One Zone-IA、Glacier Instant、Flexible、Deep Archive,均允許。
  • 透過生命週期轉換到 S3 Standard-IA 或 One Zone-IA 之前,需在 S3 Standard 停留至少 30 天。
  • S3 Glacier Instant / Flexible → S3 Glacier Deep Archive,允許。
  • 小於 128 KB 的物件預設不會被轉換到 IA 層(轉換後因 128 KB 計費下限而反而更貴)。

S3 版本控制與成本最佳化儲存

S3 版本控制會保留每個物件的每一個版本,對資料保護很好,但若忘記讓非當前版本到期,就會嚴重損害成本最佳化儲存。一個啟用版本控制、每天覆寫、卻沒有非當前版本生命週期規則的儲存桶,容量會無限線性成長。請務必搭配非當前版本生命週期轉換(例如 30 天後轉換至 IA)與到期(例如 365 天後刪除)。

版本控制啟用的儲存桶可能讓費用暴增。舊的(非當前)物件版本在 S3 主控台預設檢視中看不到,但計費方式與當前版本完全相同。考題情境:「一個啟用版本控制的儲存桶大小是預期的 100 倍。」答案幾乎必定是缺少非當前版本的生命週期規則——不是 S3 的 bug。版本控制儲存桶上的成本最佳化儲存,若沒有非當前版本的生命週期規則,根本無從實現。

S3 Intelligent-Tiering — 自動駕駛的成本最佳化儲存

S3 Intelligent-Tiering 是一個單一儲存類別,會根據每個物件觀察到的存取模式自動跨層移動,無需支付擷取費,也不需要撰寫生命週期規則。它是「設定後不用管」的成本最佳化儲存選項,現在也是存取模式不明、變動或過於多樣而難以用生命週期規則捕捉的任何資料集之預設建議。

S3 Intelligent-Tiering 存取層級

Intelligent-Tiering 內部維護最多五個層級,物件依存取情況在其中移動:

內部層級 移入條件 儲存費 首位元組延遲
Frequent Access 預設;近期有存取 約 S3 Standard 價格 毫秒
Infrequent Access 30 天未存取 約 S3 Standard-IA 價格 毫秒
Archive Instant Access 90 天未存取 約 S3 Glacier Instant 價格 毫秒
Archive Access(選用) 90–730 天未存取 約 S3 Glacier Flexible 價格 分鐘–小時
Deep Archive Access(選用) 180–730 天未存取 約 S3 Glacier Deep Archive 價格 小時

前三個層級提供毫秒擷取。後兩個(Archive Access 和 Deep Archive Access)為選用功能,需要像 Glacier 一樣非同步擷取。

監控費 — 唯一的成本最佳化儲存陷阱

S3 Intelligent-Tiering 收取小額的每月監控與自動化費用——每 1,000 個受監控物件約 $0.0025。對於擁有 1,000 萬個物件的儲存桶,大約每月 $25。對大型物件而言費用微不足道,但對小型物件而言可能超過儲存費本身。

成本最佳化儲存經驗法則:不要將小於 128 KB 的物件路由到 S3 Intelligent-Tiering。監控費加上 128 KB 計費下限,會讓小型物件在 Intelligent-Tiering 上比留在 S3 Standard 更貴。

何時選 Intelligent-Tiering,何時選生命週期

情境 成本最佳化儲存選擇
存取模式未知或不可預測 Intelligent-Tiering
存取模式明確可預測(你知道第 90 天是臨界點) 生命週期明確轉換至 IA/Glacier
小型物件(< 128 KB) 留在 Standard;跳過 IA 和 Intelligent-Tiering
法規要求「第 365 天必須進入 Glacier Deep Archive」 明確生命週期(合規需要具名規則)
含冷熱混合物件的資料湖 Intelligent-Tiering
S3 Intelligent-Tiering 無擷取費、在 Frequent/Infrequent/Archive Instant 層無最低儲存天數,每個物件只需支付監控費(約每 1,000 物件 $0.0025/月)。在存取模式不確定時,它是現代成本最佳化儲存的預設選擇。SAA-C03 考題非常愛用「存取模式未知或變動中」這個表述——這個表述直接對應 Intelligent-Tiering。

S3 Storage Lens — 成本最佳化儲存的全局可視性

S3 Storage Lens 是一個帳戶級(或組織級)分析服務,提供橫跨所有 S3 儲存桶的物件儲存指標儀表板。它是成本最佳化儲存計畫的可視性工具。

S3 Storage Lens 能顯示什麼

  • 使用量指標 — 總位元組數、物件數量、平均物件大小、各儲存類別細分。
  • 活動指標 — GET/PUT/LIST 請求數、資料擷取量、上傳與下載位元組。
  • 成本最佳化指標 — 持有的非當前版本儲存量、未完成多部分上傳位元組、可被轉換的物件。
  • 資料保護指標 — 加密覆蓋率、版本控制覆蓋率、複寫覆蓋率。

S3 Storage Lens 方案層級

  • 免費方案 — 28 個帳戶級指標,儀表板保留 14 天資料。
  • 進階指標與建議(付費) — 35+ 個指標、15 個月保留期、前綴層級彙總、情境化成本最佳化儲存建議(例如「對儲存桶 X 啟用 Intelligent-Tiering」)。

Storage Lens 的典型成本最佳化儲存用途

解決方案架構師啟用組織級 S3 Storage Lens,標記以下儲存桶:

  • 非當前版本儲存比率高 → 新增版本生命週期規則。
  • 未完成多部分上傳位元組高 → 新增中止規則。
  • 大量物件停在 S3 Standard 超過 90 天但存取率低 → 啟用 Intelligent-Tiering 或生命週期。

Storage Lens 是成本最佳化儲存的「雷達」。沒有它,你等於在幾百個儲存桶中盲飛。

S3 Storage Lens 預設儀表板免費,涵蓋帳戶中所有儲存桶。進階指標每百萬受監控物件每月約 $0.20,但可解鎖前綴層級下鑽與成本最佳化建議。對任何擁有超過 10 個儲存桶的帳戶而言,開啟 Storage Lens 通常是成本最佳化儲存審查的第一步。

Amazon EBS 成本 — 區塊儲存的成本最佳化

Amazon EBS 磁碟區是第二大成本最佳化儲存目標。與 S3 不同,EBS 沒有儲存類別階梯——成本最佳化儲存的槓桿在於磁碟區類型選擇、磁碟區大小、快照管理與快照封存。

EBS gp3 vs gp2 — 最容易實現的成本最佳化儲存改善

最常見的 EBS 成本最佳化儲存改善就是將 gp2 磁碟區切換至 gp3。兩者提供類似的基準效能,但:

  • gp2 — 基準 IOPS 隨大小擴展(3 IOPS/GB)。要獲得 6,000 IOPS,必須佈建 2 TB 磁碟區。
  • gp3 — 無論大小,基準皆含 3,000 IOPS 和 125 MB/s 吞吐量,且容量與 IOPS 相互獨立。可獨立將 IOPS 調整至 16,000、吞吐量調整至 1,000 MB/s。

成本差異:gp3 每 GB 費用約比同大小 gp2 便宜 20%。對於因 IOPS 需求而過度佈建 gp2 的工作負載,節費幅度可達 50%——因為你可以縮小磁碟區以符合實際容量,同時保持 IOPS。從 gp2 遷移至 gp3 是即時、不中斷的 modify 操作——零停機、不移動資料。這讓 gp3 成為 SAA-C03 情境中每個新磁碟區的預設成本最佳化儲存選擇。

EBS 磁碟區類型成本階梯

磁碟區類型 使用情境 每 GB 相對成本 IOPS 模型
sc1(HDD 冷儲存) 不常存取的大型資料 最便宜 吞吐量受限,最高 250 IOPS
st1(HDD 吞吐量) 大資料、日誌處理 最高 500 IOPS
gp3(SSD 通用型) 大多數工作負載的預設 低中 3,000–16,000 IOPS
gp2(SSD 通用型) 傳統預設 中(比 gp3 貴 20%) 3 IOPS/GB
io2(SSD 佈建 IOPS) 關鍵任務資料庫 64,000 IOPS,99.999% 耐久性
io2 Block Express SAP HANA、極端資料庫 最高 256,000 IOPS

EBS 的成本最佳化儲存從一個根本問題開始:這個磁碟區真的需要 SSD 嗎?如果它存放的是日誌、備份或批次讀取資料集,st1 或 sc1 HDD 的成本只是 gp3 的一小部分,卻能滿足吞吐量需求。未掛載的 EBS 磁碟區(「殭屍磁碟區」)會以全價永久計費——AWS Compute Optimizer 和 Trusted Advisor 會找出這些磁碟區供清理。

EBS 快照儲存成本

EBS 快照是儲存在 S3(由 AWS 管理,你看不到那個儲存桶)的區塊層級備份。快照在第一個之後是增量式的:只儲存變更的區塊,使其成為定期備份的成本效益方案。但快照的計費方式是每 GB 儲存的唯一資料,在 us-east-1 約 $0.05/GB-月——大約是 S3 Standard 的 2 倍,因為快照包含區塊層級的中繼資料和即時還原能力。

成本最佳化儲存備份的兩個槓桿:

  1. 快照生命週期 — 使用 Amazon Data Lifecycle Manager(DLM)或 AWS Backup 計畫自動讓舊快照到期。
  2. 快照封存層 — 推出的低成本快照層,供罕見存取的快照使用。

EBS 快照封存 — 長期備份的成本最佳化儲存

EBS Snapshot Archive 是一個低成本快照層,適用於需要保留以供合規但極少還原的快照。封存快照費用約 $0.0125/GB-月(比標準快照便宜約 75%),但:

  • 在封存層的最低保留期為 90 天。
  • 還原回標準層需要 24–72 小時。
  • 還原時需支付每 GB 擷取費。

典型的成本最佳化儲存模式:將每日快照保留在標準層 7 天(快速還原),再將每月快照移至封存層長期保留。

EBS Snapshot Archive 有 90 天最低保留期。將快照移入封存層後 10 天就刪除,仍會被收取完整 90 天的封存費用;若有先還原,還要加上每 GB 擷取費。永遠不要封存你可能需要快速存取的快照——那樣反而增加淨成本。快照的成本最佳化儲存要求你確定幾個月內都不會碰它們。

Amazon EFS-IA 生命週期 — 共享檔案的成本最佳化儲存

Amazon EFS(Elastic File System)是一個區域性的共享 NFS 檔案系統。EFS 的成本最佳化儲存關鍵在於 EFS 生命週期管理,它會自動在以下層級之間移動檔案:

  • EFS Standard — 多 AZ、毫秒延遲,預設層級。
  • EFS Standard-IA(Infrequent Access) — 多 AZ、毫秒首位元組延遲,每 GB-月費用約比 Standard 便宜 92%,但需支付每 GB 讀取費。
  • EFS One Zone — Standard 的單 AZ 版本(便宜 20%,沒有 AZ 故障保護)。
  • EFS One Zone-IA — 單 AZ IA 層,最便宜的 EFS 層級,適用於可輕易重建的資料。

EFS 生命週期政策

EFS 生命週期管理會將在設定期間(7、14、30、60、90、180、270 或 365 天)未被存取的檔案移入 IA 層。附帶規則也可以在檔案被存取時將其移回 Standard(「EFS 的 Intelligent-Tiering」)。

典型的成本最佳化儲存 EFS 設定:

  • 30 天無存取後轉換至 IA。
  • 存取時轉換回 Standard(避免對再度變熱的檔案重複支付 IA 擷取費)。

效果:一個 80% 冷資料的 10 TB EFS 檔案系統,每月費用從約 $3,000 降至 $800 以下。對於只有一小部分真正活躍的大型檔案系統而言,這是巨大的成本最佳化儲存效益。

一般用途的檔案系統務必啟用 EFS 生命週期管理,設定「30 天後轉換至 IA」與「存取時轉換回 Standard」。這讓 EFS 獲得類似 Intelligent-Tiering 的自動化機制,也是 EFS 部署上最大的單一成本最佳化儲存槓桿。

AWS Storage Gateway 成本模式

AWS Storage Gateway 是讓內部部署工作負載存取 AWS 儲存服務的混合式服務。在成本最佳化儲存方面,每種 Storage Gateway 模式有不同的成本結構:

Storage Gateway 模式成本比較

模式 計費元件 成本最佳化儲存說明
S3 File Gateway 閘道每小時費 + 寫入 S3 的資料費 + S3 儲存類別費 + 請求費 若資料目標為 S3-IA 或 Glacier,費用最低
FSx File Gateway 閘道每小時費 + 底層 FSx 檔案系統費 依 FSx 成本模型調整
Volume Gateway(Cached) 閘道費 + EBS 快照儲存費 + S3 儲存費 成本隨快照頻率擴展
Volume Gateway(Stored) 閘道費 + S3 中的完整磁碟區費 + EBS 快照費 較高——完整資料在 S3,用於 DR
Tape Gateway 閘道費 + 虛擬磁帶庫(S3 / Glacier / Deep Archive) 磁帶替換最便宜——封存至 Deep Archive

Tape Gateway 是企業封存遷移的成本最佳化儲存大贏家。實體磁帶庫每年光媒體、機械手臂硬體與異地儲存就要數萬美元。Tape Gateway 將其虛擬化至 S3 Glacier Deep Archive,費用約每 TB-月 $1,同時保持備份軟體(NetBackup、Veeam、Veritas)不變,徹底消除實體基礎架構。

S3 File Gateway 搭配底層儲存桶使用 S3 Intelligent-Tiering,可讓內部部署透過 SMB/NFS 存取,底層自動進行雲端分層成本最佳化儲存——這是常見的混合模式。

S3 Glacier 保存庫政策與 Vault Lock

S3 Glacier 保存庫(vault) 是傳統 Glacier API 的基本單位(與 S3 儲存桶分開),S3 Glacier Vault Lock 則是受規管封存的合規級成本最佳化儲存功能。

保存庫存取政策 vs Vault Lock 政策

  • 保存庫存取政策 — 控制誰可以讀寫保存庫。可變更。類似儲存桶政策。
  • Vault Lock 政策不可變更的政策,透過兩步驟流程鎖定:InitiateVaultLock(將政策設為進行中狀態,24 小時內可測試與中止)→ CompleteVaultLock(永久鎖定;即使是根帳戶也無法刪除)。

合規封存的常見 Vault Lock 政策模式:

  • 「拒絕刪除保存期未滿 7 年的封存資料」——執行 SEC、FINRA、HIPAA 保留規定。
  • 「拒絕對封存中繼資料進行任何變更」——WORM 合規。
  • 「刪除時需要 MFA」——邊緣情況的額外控制。

S3 Object Lock vs Glacier Vault Lock

現代等效方案是一般 S3 儲存桶上的 S3 Object Lock(含 Governance 或 Compliance 保留模式)。對於新的成本最佳化儲存設計,建議使用 S3 Object Lock 搭配生命週期至 Glacier Deep Archive。Glacier Vault Lock 對傳統直接使用 Glacier API 的部署仍然有效。

S3 Glacier Vault Lock 一旦完成就不可變更——即使是 AWS 帳戶根使用者也無法移除。這是刻意為之的合規功能:稽核機關接受它等同於 WORM 磁帶。若考題問「哪個 AWS 服務提供不可被管理員覆寫的法規級 WORM 保留機制」,答案是 S3 Glacier Vault Lock(傳統)或 S3 Object Lock(Compliance 模式,現代)。兩者都是重度受規管工作負載的成本最佳化儲存一部分。

成本最佳化儲存情境 — 封存、DR 與冷資料

SAA-C03 的成本最佳化儲存題目集中在三個反覆出現的情境。掌握每個情境的決策。

情境一:7 年合規封存(罕見存取)

「一家金融服務公司必須保留交易記錄 7 年。只有在監管機構稽核時才需要還原,稽核每 1–2 年發生一次,且可接受 24 小時的回應時間。」

  • 成本最佳化儲存答案:S3 Glacier Deep Archive 搭配 7 年後到期的生命週期規則。結合 S3 Object Lock(Compliance 模式)以實現 WORM。若傳統備份軟體寫入磁帶,可使用 Storage Gateway Tape Gateway。
  • 陷阱:S3 Glacier Flexible Retrieval 對此過於昂貴——Deep Archive 便宜 3.6 倍。S3 Standard-IA 的儲存費用是此擷取模式的 12 倍,且完全不適合。

情境二:災難復原副本(不常讀取,AZ 安全)

「某公司在 us-east-1 運行生產環境,並希望在 us-west-2 保留 S3 資料的 DR 副本。DR 副本只在真實災難時才讀取(可能 5 年一次)。」

  • 成本最佳化儲存答案:S3 Cross-Region Replication(CRR),目標規則設為 S3 Glacier Flexible Retrieval 或 S3 Standard-IA。對需分鐘級擷取的暖待機 DR,選 Glacier Flexible;對可能需要在幾分鐘內使用的引導燈 DR,選 Standard-IA。避免在目標使用 S3 Standard——你會為幾乎從不讀取的資料付全額費用。
  • 陷阱:在某些設定下,S3 Glacier Deep Archive 不支援作為 CRR 的直接目標——請確認目前支援的組合。

情境三:存取模式未知的冷資料

「一個資料分析團隊儲存了 500 TB 的歷史事件資料。大部分從不被查詢,但偶爾新的 ML 模型需要掃描一整年的資料。」

  • 成本最佳化儲存答案:S3 Intelligent-Tiering 並啟用選用的 Archive Access 層。這會自動處理未知模式,無需撰寫生命週期規則。以 Amazon Athena 支援分析可實現無伺服器查詢,無需移動資料。
  • 陷阱:S3 Glacier Flexible Retrieval 對臨時模型訓練太慢——1 分鐘至 12 小時的還原時間嚴重影響開發效率。Intelligent-Tiering 搭配 Archive Instant Access 層,讓停在該層的物件保持毫秒存取。

成本最佳化儲存必記數字

  • S3 Standard 耐久性:11 個 9(99.999999999%)。可用性 99.99%。
  • S3 Standard-IA 最低儲存天數:30 天。最低計費物件大小:128 KB。
  • S3 One Zone-IA:99.5% 可用性(單一 AZ)。比 Standard-IA 便宜 20%。
  • S3 Glacier Instant Retrieval 最低天數:90 天。擷取延遲:毫秒。
  • S3 Glacier Flexible Retrieval 最低天數:90 天。擷取時間:1 分鐘–12 小時(Expedited、Standard、Bulk)。
  • S3 Glacier Deep Archive 最低天數:180 天。擷取時間:12–48 小時。
  • S3 Intelligent-Tiering:無擷取費、Frequent/Infrequent 層無最低保留天數,監控費約每 1,000 物件 $0.0025/月。
  • EBS gp3:每 GB 比 gp2 便宜 20%,IOPS/吞吐量可獨立調整。
  • EBS 快照:第一個快照後為增量式,儲存在 AWS 管理的 S3,約 $0.05/GB-月。
  • EBS Snapshot Archive:比標準快照層便宜 75%,最低 90 天,還原需 24–72 小時。
  • EFS-IA:比 EFS Standard 便宜約 92%,需支付每 GB 讀取費。
  • S3 Storage Lens:免費方案 28 個指標/保留 14 天,進階方案新增前綴層級與 15 個月保留期。
SAA-C03 考題反覆引用的成本最佳化儲存數字:Deep Archive 最低 180 天/12–48 小時擷取/最便宜;Glacier Instant 90 天/毫秒擷取/中階封存層;Standard-IA 30 天/128 KB 最低物件計費/毫秒擷取;Intelligent-Tiering 無擷取費但每 1,000 物件收監控費;EBS gp3 比 gp2 便宜約 20%;EFS-IA 比 EFS Standard 便宜約 92%。把這些數字背熟——考題直接引用它們。

成本最佳化儲存常見考試陷阱

  1. 「最便宜的儲存」≠「最便宜的總費用」 — 30、90、180 天的最低儲存天數,在工作負載實際頻繁異動資料時可能翻轉答案。
  2. IA 類別最低物件大小為 128 KB — 小於 128 KB 的物件按 128 KB 計費。小型物件為主的儲存桶在 S3 Standard 上通常比 Standard-IA 便宜。
  3. Glacier 擷取費會複利累積 — 從 Deep Archive 擷取 10 TB 可能花費數千美元。對有定期(每月)存取的情境,Deep Archive 是錯誤的成本最佳化儲存選擇。
  4. S3 Intelligent-Tiering 監控費 是按物件數而非按 GB 收取——對數十億個小型物件不利。
  5. 版本控制儲存桶需要非當前版本生命週期規則,否則會無限成長。
  6. EBS 快照為增量式 — 刪除「中間」的快照不會釋放其所有 GB,因為該快照的唯一區塊仍被其他快照引用。
  7. EBS Snapshot Archive 有 90 天最低保留期 — 在幾天內封存後還原,成本高於留在標準快照層。
  8. S3 One Zone-IA 在 AZ 毀損時會遺失資料 — 成本最佳化儲存僅適用於可重建資料(日誌、轉碼媒體)。
  9. 跨區域複寫在目的地增加儲存費 + 傳輸費 — 只複寫 DR 真正需要的內容。
  10. S3 Requester Pays 將資料傳輸費轉移給請求者 — 適用於公開資料集,但需注意 IAM 與計費影響。
S3 Glacier Instant Retrieval 聽起來便宜,因為「Glacier」暗示封存定價,但它有 $0.03/GB 的擷取費——是 Standard-IA 擷取費的 3 倍。對每月存取一次的資料集,Standard-IA 的總費用優於 Glacier Instant。Glacier Instant 只有在每季甚至更少的存取頻率、同時需要毫秒擷取時才符合成本最佳化儲存的目標。選它之前務必先算清楚擷取費。

成本最佳化儲存設計清單

在交付任何成本最佳化儲存架構前,執行此清單:

  1. S3 Storage Lens 是否已在帳戶或組織層級啟用?
  2. 每個儲存桶是否有生命週期規則,在 7 天後中止未完成的多部分上傳?
  3. 每個啟用版本控制的儲存桶,是否有非當前版本轉換與到期規則?
  4. 存取模式未知的物件,是否已放在 S3 Intelligent-Tiering?
  5. 合規封存資料,是否以 S3 Glacier Deep Archive 搭配 Object Lock(Compliance 模式)為目標?
  6. 所有 gp2 磁碟區,是否已評估是否可遷移至 gp3?
  7. EBS 快照,是否由 Data Lifecycle Manager 或 AWS Backup 計畫管理並設有到期規則?
  8. 需長期保留的 EBS 快照,是否已移至 Snapshot Archive?
  9. EFS 檔案系統,是否啟用了生命週期管理(移入 EFS-IA 並設定存取時回移)?
  10. 未使用的 EBS 磁碟區(狀態為「available」)與孤立快照,是否已被 Trusted Advisor 標記?
  11. 對於內部部署整合,Storage Gateway 模式是否符合存取模式(封存用 Tape Gateway,混合雲檔案用 File Gateway)?
  12. 跨區域複寫的範圍,是否限制在 DR 確實需要的物件,而非整個儲存桶?

成本最佳化儲存 vs 效能 — 取捨

成本最佳化儲存從來不是純粹的最小化。每個選擇都有效能或營運代價:

  • 較冷的 S3 類別節省費用,但以擷取延遲為代價。
  • S3 One Zone-IA 節省 20%,但讓你暴露在 AZ 層級的資料遺失風險。
  • 較小的 EBS 磁碟區節省費用,但在 gp2 上可能造成 IOPS 瓶頸。
  • EFS-IA 節省每 GB 儲存費,但按 GB 收取讀取費。
  • Glacier 擷取需要數小時,阻塞對延遲敏感的消費者。
  • Snapshot Archive 還原需要 24–72 小時。

SAA-C03 成本最佳化儲存題目,獎勵能在費用與工作負載實際所需 SLA 之間取得平衡的考生——而非追求最便宜的標題數字。當兩個選項都符合 SLA 時,選較便宜的;當便宜的選項破壞 SLA 時,選符合 SLA 的那個。

成本最佳化儲存與其他 SAA-C03 主題的關聯

  • 可擴展儲存解決方案(3.1) — 成本最佳化儲存是同一組服務的成本視角。相同的 S3 類別、EBS 類型、EFS 層——不同的最佳化目標。
  • 資料治理與合規(1.3) — 合規保留期強制要求某些成本最佳化儲存選擇(Object Lock + Glacier Deep Archive)。
  • 災難復原策略(2.2) — DR 副本是成本最佳化儲存的主要挑戰;CRR 至 Standard-IA 或 Glacier 是標準做法。
  • 成本最佳化資料庫(4.3) — 資料庫共用快照與備份的成本最佳化儲存模式(RDS 快照、Aurora backtrack、DynamoDB PITR)。
  • 成本最佳化網路(4.4) — 成本最佳化儲存層的資料傳入/傳出費用是總成本的一部分;S3 的 Gateway endpoint 可避免 NAT Gateway 費用。

FAQ — 成本最佳化儲存熱門問題

Q1:最便宜的 S3 儲存類別是什麼,成本最佳化儲存的取捨是什麼?

S3 Glacier Deep Archive 是最便宜的 S3 儲存類別,在 us-east-1 約 $0.00099/GB-月——比 S3 Standard 便宜約 23 倍。成本最佳化儲存的取捨:12–48 小時的擷取時間、180 天的最低儲存天數、每 GB 擷取費(Standard 擷取約 $0.02/GB),以及每次請求費。Deep Archive 只適用於最多每年存取一兩次的合規或長期封存。若用於有定期存取需求的資料,反而會因擷取費而成為最昂貴的成本最佳化儲存選擇。

Q2:S3 Intelligent-Tiering 和 S3 生命週期政策在成本最佳化儲存上如何比較?

S3 Intelligent-Tiering 是自動化的、以物件為單位,基於實際觀察到的存取情況運作。它收取小額監控費(約每 1,000 物件 $0.0025/月),但主要層級無擷取費。S3 生命週期政策是規則式的——你明確指定「第 30 天轉換至 IA、第 365 天轉換至 Glacier Deep Archive、第 2555 天到期刪除」。存取模式未知或混合時,用 Intelligent-Tiering;模式可確定或合規規則需要具名轉換日期時,用生命週期。在大多數現代資料湖的成本最佳化儲存中,Intelligent-Tiering 是預設答案。

Q3:為什麼要將 EBS gp2 遷移至 gp3 以實現成本最佳化儲存?

gp3 每 GB-月費用約比 gp2 便宜 20%,且 IOPS 與吞吐量與磁碟區大小解耦。在 gp2 上,獲得 6,000 基準 IOPS 需要一個 2 TB 的磁碟區(即使你只需要 200 GB)。在 gp3 上,你佈建 200 GB 並獨立設定 IOPS 為 6,000,同時削減儲存費和浪費的容量。遷移是即時、不中斷的 ModifyVolume 操作——零停機。每一份現代成本最佳化儲存審查都應包含 gp2 轉 gp3 的全面盤點。

Q4:S3 Intelligent-Tiering 一定比 S3 Standard 省錢嗎?

不一定。對於擁有數百萬個極小物件(< 128 KB)的儲存桶,Intelligent-Tiering 的每物件監控費可能超過節省的儲存費。IA 層儲存的 128 KB 最低計費下限,意味著小型物件實際上按 128 KB 計費,即使只有 1 KB。對小型物件工作負載的成本最佳化儲存,請留在 S3 Standard。Intelligent-Tiering 對大於 128 KB 且存取模式不確定的物件最有效。

Q5:EBS Snapshot Archive 和 S3 Glacier Deep Archive 在長期備份成本最佳化儲存上有何不同?

EBS Snapshot Archive 專為 EBS 快照設計——它保留增量區塊結構,因此還原到磁碟區需要 24–72 小時,但還原後保留即時掛載為磁碟區的語意。S3 Glacier Deep Archive 儲存任意物件,不了解 EBS 區塊結構。如果你需要還原 EBS 磁碟區,必須使用 Snapshot Archive(或將快照保留在標準層)。如果你只需要從磁碟區匯出的原始資料,可以匯出至 S3 再生命週期至 Deep Archive,費用大幅降低,但還原工作複雜得多。

Q6:S3 Storage Lens 如何協助成本最佳化儲存計畫?

S3 Storage Lens 是帳戶或組織範圍內成本最佳化儲存的可視性工具。它呈現各儲存類別消耗的儲存量、非當前版本儲存比率、未完成多部分上傳位元組,以及可受益於轉換的物件。進階方案(付費)新增前綴層級下鑽與明確的成本最佳化建議。對任何擁有超過幾個儲存桶的 AWS 帳戶而言,開啟 Storage Lens 是成本最佳化儲存審查的第一步——你無法最佳化你看不到的東西。

Q7:S3 Cross-Region Replication(CRR)在 DR 成本最佳化儲存上何時值得?

CRR 讓你的儲存帳單倍增(兩份副本),還要加上跨區域資料傳輸費(約 $0.02/GB)。只有在 DR 需要對抗區域級故障時才值得——法規要求、極低 RTO,或業務連續性需求。對 DR 副本的成本最佳化儲存,務必透過複寫儲存類別覆寫,將目標儲存桶設為 S3 Standard-IA 或 S3 Glacier Flexible Retrieval(而非 S3 Standard)。將複寫範圍限制在 DR 實際需要的前綴或標籤;把整個資料湖複寫到另一個區域通常是過度設計。

延伸閱讀:成本最佳化儲存

成本最佳化儲存最終應試提示

  1. 背熟 S3 儲存類別最低天數(30/90/180 天)和擷取延遲——SAA-C03 考題直接引用。
  2. 看到「存取模式未知或變動中」,立即聯想到成本最佳化儲存問題中的 S3 Intelligent-Tiering。
  3. 除非情境明確可接受 12 小時以上的擷取等待,否則不要選 S3 Glacier Deep Archive。
  4. 新 EBS 磁碟區預設選 gp3;將 gp2 標記為傳統成本最佳化儲存浪費。
  5. 每個版本控制儲存桶都要搭配非當前版本的生命週期規則。
  6. 每個使用多部分上傳的工作負載都要搭配中止未完成上傳的生命週期規則。
  7. 啟用 EFS 生命週期管理,讓冷資料自動移入 EFS-IA。
  8. 內部部署 Windows/Linux 磁帶替換,成本最佳化儲存答案是 Storage Gateway Tape Gateway 至 Glacier Deep Archive。
  9. 受規管封存的 WORM 需求,搭配 S3 Object Lock(Compliance 模式,現代)或 Glacier Vault Lock(傳統),與 Deep Archive 一起使用。
  10. 每一道成本最佳化儲存情境都從同一個問題開始:存取模式是什麼?回答了這個問題,儲存類別自然就選出來了。

掌握這些成本最佳化儲存模式,SAA-C03 領域 4 任務 4.1 就成為穩定的得分來源——而同樣的模式也能直接降低生產環境的真實 AWS 帳單。

官方資料來源