Chương 2


CHƯƠNG 2. MÔ HÌNH LƯU TRỮ.

Mục. Hỗn hợp nguồn (Kết xuất + Tài liệu AWS chính thức).

Topic này kết hợp các pattern tần suất cao trong dump với tài liệu chính thức của AWS.

Tín hiệu từ dump (tần suất): S3 (1829), replication (182), EFS (145), FSx (94), Storage Gateway (46), DataSync (55), Transfer Family (11).

Mục. 1) Khung quyết định lưu trữ (Thi SAP-C02 nhanh).

Đầu tiên xác định loại giao diện: Object (S3), File (EFS/FSx), Block (EBS – ngoài trọng tâm topic này).

Sau đó map giao thức truy cập: HTTP/S3 API, NFS, SMB, iSCSI, FTP/SFTP/FTPS/AS2.

Tiếp theo phân loại mô hình truy cập: nóng, ấm, lưu trữ lạnh; truy cập dự đoán được hay không.

Cuối cùng áp ràng buộc: RTO/RPO, compliance (WORM, retention), chia sẻ cross-account và trần chi phí.

Mục. 2) Amazon S3 Core + Nâng cao.

Mục. 2.1 Lớp lưu trữ và logic vòng đời.

S3 Standard là mặc định cho dữ liệu truy cập thường xuyên với độ trễ mili-giây.

S3 Intelligent-Tiering phù hợp nhất khi pattern truy cập chưa rõ hoặc thay đổi theo thời gian.

Standard-IA và One Zone-IA dùng cho truy cập không thường xuyên; có phí retrieval.

Glacier Instant/Flexible/Deep Archive dành cho lưu trữ dài hạn, thời gian khôi phục chậm hơn.

Lifecycle transition + expiration là phần rất hay xuất hiện; luôn kiểm tra ảnh hưởng của thời gian lưu tối thiểu.

Mục. 2.2 Sao chép và DR với S3.

Live replication hỗ trợ CRR (khác Region) và SRR (cùng Region).

Với object đã tồn tại trước đó, dùng S3 Batch Replication (replication theo yêu cầu).

S3 RTC cung cấp mục tiêu replication có thể dự đoán (99.99% object mới trong 15 phút, có SLA).

Với thiết kế failover đa Region bằng Multi-Region Access Points, thường cần mẫu replication hai chiều.

Mục. 2.3 Lập phiên bản và khóa đối tượng.

Versioning là nền tảng cho rollback, khôi phục xóa nhầm và nhiều mẫu bảo vệ dữ liệu.

Object Lock dùng mô hình WORM; hỗ trợ retention mode (governance/compliance) và legal hold.

Object Lock chỉ hoạt động trên bucket đã bật versioning.

Mục. 2.4 Tích hợp hiệu suất và sự kiện.

Với upload toàn cầu, S3 Transfer Acceleration dùng mạng edge của CloudFront để cải thiện hiệu năng truyền xa.

Với object lớn, multipart upload là mẫu bắt buộc để scale upload.

Đích nhận event của S3 gồm SNS, SQS, Lambda, EventBridge.

Event notification của S3 không hỗ trợ SQS FIFO trực tiếp; cần qua EventBridge nếu bắt buộc FIFO.

Mục. 2.5 Kiểm soát bảo mật cho S3.

Kết hợp bucket policy, IAM policy và KMS key policy cho truy cập cross-account.

Ưu tiên least privilege theo action và resource; xác minh quyền API bắt buộc một cách tường minh.

Mục. 3) Amazon EFS (NFS, lưu trữ tệp POSIX được chia sẻ).

Mục. 3.1 Khi nào nên sử dụng EFS.

Dùng EFS khi nhiều node compute cần dùng chung storage co giãn, chuẩn POSIX (thiên Linux).

Phù hợp cho container, worker analytics, web fleet và kho nội dung dùng chung.

Mục. 3.2 Chế độ hiệu suất và thông lượng.

EFS có performance mode: General Purpose và Max I/O.

General Purpose là mặc định và được khuyến nghị vì độ trễ theo thao tác thấp hơn.

Max I/O phù hợp workload rất song song nhưng đánh đổi bằng độ trễ cao hơn.

Throughput mode gồm Elastic, Provisioned và Bursting.

Elastic throughput tự co giãn thông lượng; hợp khi lưu lượng khó dự đoán.

Provisioned throughput cho nhu cầu thông lượng ổn định, biết trước.

Bursting gắn thông lượng baseline theo dung lượng hệ file và cơ chế burst credit.

Mục. 3.3 Lớp lưu trữ EFS.

EFS Standard cho dữ liệu truy cập thường xuyên và độ trễ thấp.

EFS IA / EFS Archive cho dữ liệu ít truy cập (độ trễ first-byte cao hơn Standard).

Mục. 4) Dòng Amazon FSx (Chọn đúng hương vị).

Mục. 4.1 FSx cho Máy chủ tệp Windows.

File server Windows managed, hỗ trợ SMB và tích hợp AD native.

Hợp cho home directory Windows, ứng dụng doanh nghiệp và shared folder.

Hỗ trợ triển khai Single-AZ và Multi-AZ.

Mục. 4.2 FSx cho độ bóng.

Tối ưu cho HPC/ML, thông lượng rất cao và độ trễ thấp cho workload song song.

Scratch dành cho dữ liệu tạm; Persistent dành cho workload cần độ bền.

Mục. 4.3 FSx cho NetApp ONTAP.

Storage doanh nghiệp đa giao thức (NFS/SMB/iSCSI/NVMe) với khả năng ONTAP đầy đủ.

Hữu ích cho migration doanh nghiệp cần mô hình quản trị dữ liệu ONTAP quen thuộc.

Mục. 4.4 FSx cho OpenZFS.

OpenZFS managed với truy cập NFS, snapshot/clone và tùy chọn cache hiệu năng cao.

Hợp cho workload Linux/macOS và lift-and-shift từ môi trường tương tự ZFS.

Mục. 5) Dịch vụ kết hợp/chuyển giao (Gần bộ nhớ nhưng được thử nghiệm kỹ lưỡng).

Mục. 5.1 Cổng lưu trữ AWS.

Cầu nối ứng dụng on-prem với storage trên AWS.

Các mode chính gồm File Gateway (truy cập S3/FSx), Volume Gateway (iSCSI), Tape Gateway (mô hình băng từ ảo).

Mục. 5.2 Đồng bộ hóa dữ liệu AWS.

Dịch vụ truyền dữ liệu managed, tốc độ cao, bảo mật giữa on-prem/object/file store và storage AWS.

Hỗ trợ nguồn NFS/SMB/HDFS/object và đích S3, EFS, các hệ FSx.

Mục. 5.3 Nhóm chuyển giao AWS.

Endpoint truyền file managed qua SFTP/FTPS/FTP/AS2 (và web app transfer) vào S3 hoặc EFS.

Pattern rất hay gặp trong dump: thay SFTP tự host trên EC2 bằng Transfer Family để tăng độ tin cậy và giảm vận hành.

Mục. 6) Các mẫu bài kiểm tra có nguồn gốc từ kết xuất cho Chủ đề-02.

Câu hỏi truy cập S3 cross-account xuất hiện nhiều; đáp án thường cần bucket policy + IAM của principal (+ quyền KMS nếu có mã hóa).

Câu hỏi lưu trữ lạnh S3 thường kiểm tra chọn class + kỳ vọng thời gian truy xuất + thời điểm lifecycle transition.

Bài toán ingest hybrid thường kiểm tra phân biệt DataSync vs Storage Gateway vs Transfer Family.

Câu hỏi DR về storage thường trộn replication + failover + ràng buộc ngân sách.

Câu hỏi migration web stateful kiểm tra chọn EFS/FSx và bẫy hiểu sai về sticky-session.

Mục. 7) Bẫy có xác suất cao.

Chọn storage One Zone cho dữ liệu chính không thể tái tạo.

Quên tác động phí retrieval/độ trễ khi chọn class lưu trữ lạnh.

Tưởng S3 event notification gửi trực tiếp vào SQS FIFO được.

Nhầm DataSync (dịch vụ di chuyển dữ liệu) với Transfer Family (endpoint giao thức truyền file).

Thiết kế replication nhưng không kiểm tra điều kiện ownership, KMS và policy.

Lạm dụng FSx khi EFS đã đủ (hoặc ngược lại) do bỏ qua yêu cầu giao thức.

Mục. 8) Thành thạo.

Khung quyết định cốt lõi cho S3/EFS/FSx.

Phân biệt cơ bản giữa DataSync, Storage Gateway và Transfer Family.

Mục. 9) Điểm yếu.

Các edge case về giá (thời gian lưu tối thiểu, kinh tế retrieval) theo từng storage class.

Chi tiết replication S3 với object mã hóa KMS và ownership cross-account.

Chọn đúng loại FSx khi có ràng buộc đa giao thức + compliance.

Mục ôn tập nhanh, flashcard.

Câu hỏi ôn tập. When is S3 Intelligent-Tiering usually best?

Trả lời. When access patterns are unknown or frequently changing.

Câu hỏi ôn tập. Khi nào ưu tiên S3 Glacier Deep Archive?

Trả lời. Khi dữ liệu rất hiếm khi truy xuất và mục tiêu chính là tối ưu chi phí lưu trữ dài hạn.

Câu hỏi ôn tập. What does S3 Object Lock provide?

Trả lời. WORM protection with retention modes and legal hold on object versions.

Câu hỏi ôn tập. Object Lock yêu cầu điều kiện nền nào?

Trả lời. Bucket phải bật Versioning.

Câu hỏi ôn tập. CRR vs SRR?

Trả lời. CRR replicates across Regions; SRR replicates within the same Region.

Câu hỏi ôn tập. S3 RTC dùng để làm gì?

Trả lời. Đảm bảo mục tiêu replication có thể dự đoán cho object mới (SLA-backed).

Câu hỏi ôn tập. EFS General Purpose vs Max I/O?

Trả lời. General Purpose has lower latency; Max I/O supports highly parallel workloads with higher latency.

Câu hỏi ôn tập. Khi nào dùng FSx for Windows File Server?

Trả lời. Khi workload cần SMB/AD native cho ứng dụng Windows doanh nghiệp.

Câu hỏi ôn tập. Khi nào dùng FSx for Lustre?

Trả lời. Khi cần thông lượng cực cao cho HPC/ML, xử lý song song dữ liệu lớn.

Câu hỏi ôn tập. DataSync khác gì Transfer Family?

Trả lời. DataSync là dịch vụ di chuyển dữ liệu batch/replication; Transfer Family là endpoint giao thức truyền file (SFTP/FTPS/FTP/AS2) cho người dùng/hệ thống kết nối vào.

Câu hỏi ôn tập. S3 event gửi vào SQS FIFO trực tiếp được không?

Trả lời. Không; cần dùng EventBridge nếu muốn đi tới FIFO.

Câu hỏi ôn tập. Dấu hiệu đề muốn Transfer Family là gì?

Trả lời. Đề nói migrate SFTP/FTPS/FTP cũ sang managed service và giảm vận hành.

Mục. 11) Bài tập tiếp theo.

Kết thúc chương.