Lựa chọn phần cứng

1. Base server

Có tới hàng trăm server của nhiều hãng phần cứng máy chủ như Dell, HPE, Supermicro, Cisco, Fujitsu, lenovo… có thể đáp ứng các yêu cầu làm node vSAN. Việc chọn lựa Base server cần đáp ứng các tiêu chí như sau:

+ Là HW phổ thông(sử dụng phổ biến ở thị trường nội địa) có thể có part thay thế bất cứ lúc nào, và được nằm trong list HCL của VMware

+ Hãng phần cứng chất lượng tốt và có vòng đời hỗ trợ update firmware dài hạn( 5- 7 năm)

+ Nên chọn hãng có hw không bị locked firmware( HPE điểm trừ)

+ Nên chọn hãng phần cứng có tính ổn định cao và được khách hàng đã qua sử dụng đánh giá + Có thể hỗ trợ slot NVME U.2 mà không bắt buộc phải mua Disk của hãng( supermicro)

Với các tiêu chí trên Supermicro và Dell được ưa chuộng trong việc lựa chọn HW build vsan.

Trong tài liệu này này sẽ nhắc đến các model của Dell R730xd/R740xd cho dòng 2U( stoage nhiều) và dòng R630/R640 1U( save rack space)

Model max SAS3 disk slot HBA Controller Disk group *
R630/ R640 10 HBA330 mini 1 -2
R730xd 12×3.5” 12 HBA330 1 -2
R730xd 24×2.5” 24 HBA330 1- 4
R740xd 12×3.5” 12 HBA330 1- 2
R740xd 24×2.5” 24 HBA330 1- 4

* Số lượng Disk group sẽ phụ thuộc vào max slot / disk per group

Việc chọn base server hỗ trợ nhiều slot disk để hệ thống có thể scale up( tăng perf bằng cách tăng số lượng disk) trong tương lai nếu có vấn đề về perf storage cần tăng mà chưa phải thay thế bất kể 1 thành phần nào của hệ

2. Storage Device

Nếu muốn hệ thống lưu trữ nhanh, hãy mua đĩa nhanh, cụ thể là mua SSD thay vì HDD

  • Disk controller –  HBA SAS3

Mình chọn SAS3 nên sẽ chú ý vào LSI 9300-8i hoặc HBA330 của DELL, một số chassis hỗ trợ NVME

U.2 có thể còn có card PCIe khác

Cả hw và fw được hỗ trợ, tương thích với version vSAN hiện tại

  • Disk

          Type                    Capacity               Demession              Use                 IOCTRL         Latency             vSAN          DG lic

SATA SSD  500G, 960G,

1.92T

2.5” Capacity ncq low std / ent AF
NL-SAS3 4, 6, 8, 10..

(TB)

3.5” Capacity scsi higher std hybrid
SAS3 10k 1.2, 1.8, 2.4T 2.5” Capacity scsi high std hybrid
SAS3 SSD 800G, 960G,

1.6T,

1.92T,….

2.5” Capacity  / cache scsi lower ent/ std AF
NVME …. 2.5”  U.2 PCIe Cache

/ Capacity

…. very low ent AF
SCM ….   Cache …. ultra low ent AF
NVDIMM 16GB, 32GB   Cache …. ultra low ent ??

 

Với các hệ thống không quá khắt khe về perf(slow high capacity) có thể lựa chọn hybrid vsan là một lựa chọn tốt với các ưu điểm: giảm chi phí lic vsan, và giảm chi phí price per GB, tuy có hơi chậm nhưng phù hợp với hệ thống tính toán cần nhiều phần stoage Các lựa chọn disk khi build hệ thống:

  • Đơn giản nhất là All Flash với SAS3 SSD wite intensive dùng cho cache, và SATA SSD ENT cho vùng capacity vừa rẻ vừa được latency thấp( Chassis 2.5”) là lựa chọn vừa tiền và ít rủi ro khi triển khai thực tế
  • Rẻ nhất có thể dùng DiskGroup với SAS3 SSD dùng cho cache, và NL-SAS3 7.2k cho vùng capacity( Chassis 3.5”)
  • Phổ biến nhất nhất có thể dùng diskgroup với SAS3 SSD dùng cho cache, và SAS3 10k cho vùng capacity ( Chassis 2.5”, Chassis 3.5” hybrid tray)

Lưu ý Dung lượng cache phải ít nhất 25% tổng dung lượng vùng đĩa lưu trữ, mua cache lớn có thể mở rộng đĩa và perf lúc nào cũng ổn khi có tải không dự kiến trước( unpredictable workload)

3. DiskGroup

Phần này là chia disk và cache vào group, thao tác cụ thể sau này sẽ cấu hình khi init vSAN.  Phần này trực quan nhất là dùng tool sizer disk cho vsan ở phía dưới

Disk layout

Tổng thể toàn bộ disk của cụm vsan nhìn theo các node, các node phải đồng đều về DiskGroup và các DiskGroup phải giống nhau để tải chia đều trên toàn bộ cluster

Phần này trực quan nhất là dùng tool sizer disk cho vsan ở phía dưới  IO Networking

mcx354a-fcbt 40Gbps dual port > cho phần vsan

QLogic FastLinQ 41164 Quad Port 10GbE >> cho phần VM, MGMT tham khảo thêm danh sách card network cho Dell R14 https://itprice.com/dell-price-list/10g.html

CPU for vSAN

Với máy chủ Dell R640 hoặc R740xd sử dụng CPU Intel® Xeon® Gold 5218R là rất đáng giá tại thời điểm viết tài liệu gọi là Big 2nd Gen Intel Xeon Scalable Refresh, cho hiệu năng cao, số core cao, thích hợp cho ảo hoá. RAM for vSAN

vsan có sử dụng vài chục GB ram cho việc quản lý disk group chi tiết

https://blogs.vmware.com/virtualblocks/2015/11/11/vsan-design-sizing-memory-overheadconsiderations/

hoặc https://kb.vmware.com/s/article/2113954

Thông thường các node vsan tránh off để ảnh hưởng đến service, Ram cho mỗi node khuyến cáo là 256GB(R13) hoặc 384GB(R14) hoặc cao hơn tuỳ hệ thống

4. vSAN Network – Switch for vSAN, vMotion

  • Phần này dùng mã N3K-C3132Q-40GE hoặc Lenovo RackSwitch™ G8332 cho hệ thống 40Gbps phần backend storage. Nếu bố trí các node vsan và switch trong 1 tủ có thể dùng dây DAC 3m QSFP+ để giảm chi phí đầu tư mà vẫn đạt được băng thông lớn

02 mã switch đề xuất có đặc điểm port 40G thoải mái cho hệ thống từ 16 đến 32 node vsan với chi phí cực rẻ, với port 40G có thể tận dụng cho toàn bộ các trafic khác của vsan như mgmt, vmotion, vm.

Cuộc chạy đua băng thông rộng 10G / 40G và 25G/100G thì công nghệ 10G / 40G đã cũ và rẻ hơn so với vài năm trước.

Switch for VM & MGMT

Có thể dùng sw 10G như N3K-C3064PQ-10GX hoặc rất nhiều sản phẩm 10G

  • Ngoài ra có thể sử dụng các dòng switch của Dell EMC trong dòng sản phẩm S4100-ON, chẳng hạn như S4148U, S4148F, S4148FE, S4148T, S4128F, và S4128T. Đây là các thiết bị chuyển mạch 1RU, tức là chiếm 1 đơn vị rack khi lắp đặt trong tủ rack.

Các tính năng chính của loạt sản phẩm này bao gồm:

* Kích thước: Chúng là các switch có mật độ cao và chỉ cao 1RU (khoảng 1.75 inches cao).

* Cấu hình Cổng: Các switch này cung cấp nhiều tùy chọn về tốc độ cổng, từ 1 GbE tới 100 GbE (Gigabit Ethernet), với khả năng tự động điều chỉnh tốc độ trên các cổng nhất định (dual-speed).

* Công nghệ Cổng:
– Các cổng SFP+ (Small Form-factor Pluggable Plus) hỗ trợ tốc độ 1/10GbE cho phép kết nối linh hoạt với các tốc độ mạng khác nhau.
– Cổng BaseT trên mô hình S4148T-ON cho phép kết nối mạng dùng cáp đồng (cáp Ethernet thông thường).
– Cổng QSFP28 (Quad Small Form-factor Pluggable 28) hỗ trợ tốc độ lên tới 100GbE cho các ứng dụng cần băng thông cao.

* Kiến trúc Switch: Chúng sử dụng kiến trúc switching “nonblocking” và “cut-through”. “Nonblocking” nghĩa là switch có đủ băng thông để xử lý đủ lưu lượng trên tất cả các cổng cùng một lúc mà không bị nghẽn. “Cut-through” là phương pháp truyền dữ liệu mà switch bắt đầu chuyển gói tin ngay khi nó nhận đủ thông tin về điểm đến, giảm độ trễ trong mạng.

* Hệ điều hành: Các switch S4148-ON đang chạy hệ điều hành mạng OS10 của Dell trong hướng dẫn triển khai này. OS10 là một hệ điều hành mạng linh hoạt và mạnh mẽ, phục vụ nhu cầu cấu hình và quản lý switch.

* Top of Rack: Đây là các switch thường được đặt ở vị trí đầu của rack (top of rack – ToR), thích hợp cho việc kết nối với máy chủ và thiết bị lưu trữ trong một trung tâm dữ liệu.

5. Sizing vSAN

Quy mô của hệ thống vSAN dựa trên thông tin cụ thể của từng case sẽ có phương án cụ thể, và tuỳ case sẽ có tính toán cụ thể hơn để đảm bảo đầy đủ các tiêu chuẩn kỹ thuật cũng như tính kinh tế của giải pháp

Single cluster: Bắt đầu bằng hệ thống đơn giản và đầy đủ các thành phần, được coi như giai đoạn 1 của hệ thống

Stresth cluster – Fault domain sẽ là giai đoạn 2 của hệ thống

All Flash / Hybrid

Xu thế là All Flash, tiết kiệm đầu tư có thể xài hybrid

https://vsan.virtualappliances.eu/ tool khá trực quan về số node nhưng chưa thấy phần xuất BoM

https://kauteetech.github.io/vsancapacity/ Phần raid1 của hệ thống còn khoảng 33% dung lượng khả dụng, các thành phần khác dùng cho các việc khác

https://core.vmware.com/sites/default/files/resource/vmware_vsan_design_guide_noindex.pd f

https://core.vmware.com/vsan-plan-and-design

Điều chỉnh perf cho hệ thống vSAN

Có thể add thêm node, hoặc add thêm disk tuỳ option nâng cấp hệ thống