Th.S. Nguyễn Thái Hùng
Ban Quản lý Dự án TTTHVN
1. Giới thiệu mạng SAN (Storage Area Network).
Ý tưởng đặt các thiết bị lưu trữ trên một mạng SAN riêng rẽ đã dần dần được phát triển để cung cấp một mạng tốc độ cao cho nhu cầu lưu trữ và truy nhập nhanh vào dữ liệu lưu trữ.
Phương pháp lưu trữ truyền thống là các hệ thống lưu trữ được gắn trực tiếp với server qua bus SCSI (Small Computer Systems Interface) (hình 1). Qua bus SCSI, các thiết bị ngoại vi và các bộ điều khiển khác nhau có thể trao đổi thông tin. Trong hơn hai thập kỷ, SCSI là giao thức sử dụng chủ yếu cho truyền tải dữ liệu mức khối (block-level) giữa các server. Thực tế, tiêu chuẩn SCSI là một trong những yếu tố chính trong sự phát triển các hệ thống mở, cung cấp một liên kết các hệ thống lưu trữ có chỉ tiêu cao, giá thành thấp. Tuy nhiên, khi tốc độ xử lý của các bộ vi xử lý máy tính, nhu cầu lưu trữ và truy nhập vào dữ liệu lưu trữ tăng lên thì tiêu chuẩn SCSI bộc lộ một số nhược điểm và hạn chế:
• Chỉ tiêu: Phần lớn SCSI hiện nay cung cấp một đường nối đơn lẻ với thông lượng từ 40MB/s tới 80MB/s.
• Cấu hình: SCSI nối phần tử lưu trữ trực tiếp với một server. Thực hiện SCSI (Ultra SCSI) cho phép chỉ 15 thiết bị được nối với một bus SCSI.
• Khoảng cách: Các cấu hình SCSI thông thường giới hạn khoảng cách giữa các phần tử lưu trữ và server là 6m. Các công nghệ SCSI mới hơn đã gia tăng được khoảng cách này, nhưng giới hạn của khoảng cách kết nối là 25m.
• Tính khả dụng (Availability): Môi trường SCSI nối hệ thống lưu trữ với một server đơn lẻ. Nếu server hỏng sẽ dẫn tới toàn bộ truy nhập vào hệ thống lưu trữ gắn với server sẽ không thực hiện được. Các thực hiện SCSI mới hơn hỗ trợ tối đa hai initiator (server) nhưng vẫn giới hạn các cấu hình cluster và các tài nguyên lưu trữ chung.
• Bus: Một số cấu hình SCSI hỗ trợ nhiều bus. Tuy nhiên, các giới hạn về không gian không cho phép bảo đảm tất cả hệ thống lưu trữ nằm bên trong thiết bị. Do đó, các nhà quản trị hệ thống (trong môi trường SCSI) cần phải bổ sung các server và thêm các chi phí bảo dưỡng, quản lý để gia tăng dung lượng lưu trữ.
• Chi phí: Bên cạnh chi phí quản lý các server bổ sung để gia tăng dung lượng lưu trữ, sự ghép nối của server và phần tử lưu trữ sẽ hạn chế sự chia sẻ hiệu quả các tài nguyên băng từ và ổ đĩa.
Khi thực hiện mạng SAN sử dụng công nghệ Fibre Channel sẽ khắc phục được các nhược điểm của công nghệ SCSI. Bảng 1 so sánh hai công nghệ SCSI và Fibre Channel.
Hình 2 minh họa mạng SAN với việc tách riêng rẽ hệ thống lưu trữ ra khỏi mạng LAN. Khi đó, lưu lượng lưu trữ được chuyển tới một mạng riêng rẽ (mạng SAN) sẽ làm giảm lưu lượng trên mạng LAN và dữ liệu có thể được dùng chung trên bất kỳ server nào và bất kỳ phần tử lưu trữ nào. Quản lý dữ liệu cũng có thể được đơn giản hơn vì các công cụ quản lý có thể truy nhập và kiểm tra từng thiết bị riêng rẽ cũng như đưa ra một đánh giá tổng thể về lưu lượng dữ liệu trên mạng SAN.
2. Tính tương thích và các tiêu chuẩn mạng SAN.
Trước đây, sự tương thích các thành phần mạng SAN là một trong những vấn đề lớn nhất phải giải quyết. Thiết bị được sử dụng có rất ít sự tương thích, các chuyển mạch nhất định chỉ làm việc được với một số HBA (Host bus adapter) nhất định. Sự tương thích của các thiết bị Fibre Channel đã được cải thiện mặc dù nó vẫn được xem là một trong những thử thách lớn nhất khi thực hiện mạng SAN. Hiệp hội công nghiệp Fibre Channel (FCIA - Fibre Channel Industry Association) và Hiệp hội công nghiệp mạng lưu trữ (SNIA - Storage Networking Industry Association) đã làm việc trong nỗ lực chung để giải quyết vấn đề tương thích giữa các thiết bị bằng cách thiết lập các tiêu chuẩn dựa trên tiêu chuẩn Fibre Channel cho mạng SAN. Quá trình tiêu chuẩn hóa cho SAN có ba bước chính, trong đó giai đoạn đầu tiên đã được hoàn tất.
1. Thiết lập tiêu chuẩn mạng cho chuyển dịch dữ liệu và thiết lập các sơ đồ đặt tên (naming) cho các thành phần và thiết bị: Bước này đã được hoàn tất khi các tiêu chuẩn Fibre Channel cung cấp các phương tiện cần thiết cho đặt tên thiết bị và cấu hình.
2. Phát hiện (discovery) thiết bị và topology trong mạng SAN: Sự phát triển ở bước này tập trung vào việc thực hiện quản lý thiết bị qua cơ sở thông tin quản lý (MIB - Management Information Base) nằm trên mỗi thiết bị trên mạng. Quá trình quản lý thực hiện thu thập thông tin và trạng thái thiết bị. Một số lượng lớn các nhà sản xuất Fibre Channel đã thực hiện MIB trong thiết bị của mình nhưng tất cả các thiết bị không thể thực hiện giao tiếp nội bộ.
3. Trong bước thứ ba và cuối cùng, tiêu chuẩn cho các tài nguyên của mạng SAN được thể hiện dưới thuật ngữ hoàn tất gán thiết bị tự động cho các ứng dụng như dự phòng không có server (serverless backup) và phục hồi sau thảm họa (disaster recovery).
3. Topology mạng SAN.
Topology mạng SAN có thể được thực hiện bằng nhiều cách phụ thuộc vào đặc điểm của các ứng dụng và các yêu cầu:
• Quy mô của mạng lưu trữ: Từ các mạng SAN có quy mô nhỏ bao gồm một chuyển mạch hay một hub đơn lẻ cho tới các mạng SAN lớn với một số lượng lớn các chuyển mạch và các cổng.
• Đường truyền dữ liệu và nhu cầu truyền dữ liệu.
• Dự phòng dữ liệu từ xa.
• Các topology mạng SAN có thể được thiết lập bằng hai cách:
a. Kiểu tập trung: Các hệ thống lưu trữ được nối tới một chuyển mạch trung tâm có số lượng cổng lớn trong mạng SAN.
b. Kiểu mạng: Các chuyển mạch được liên kết với nhau tạo thành một mạng tuyến tính hoặc mạng lưới (mesh) nối các server và thiết bị lưu trữ.
3.1. Topology điểm-điểm.
Topology điểm-điểm là cấu hình đơn giản nhất có thể có cho mạng SAN. Cấu hình (hình 3) bao gồm một server được nối với một thiết bị lưu trữ đứng một mình.
3.2. Topology Arbitrated Loop.
Topology Arbitrated Loop bao gồm một hub đường trục và các thiết bị trong mạng được nối với hub tạo thành một mạng hình sao vật lý (hình 4).
Topology Arbitrated loop có nhược điểm là tại một thời điểm chỉ có một thiết bị được truyền dữ liệu trên mạng. Khi số lượng thiết bị trên mạng tăng lên sẽ gây ra sự sụt giảm chất lượng mạng. Do đó, Topology Arbitrated loop chỉ được sử dụng cho các mạng SAN có quy mô nhỏ và lưu lượng dữ liệu hạn chế.
3.3. Topology SAN Fabric.
Trong Fibre Channel, thuật ngữ “chuyển mạch nối giữa các thiết bị” được gọi là Fabric.
Topology SAN Fabric là topology có chỉ tiêu cao nhất và được sử dụng cho các mạng SAN có quy mô và lưu lượng dữ liệu lớn. Các fabric rất lớn có thể được xây dựng bằng cách liên kết nhiều chuyển mạch với nhau. Do đó, mạng SAN dựa trên fabric có thể được mở rộng bằng cách thêm các chuyển mạch vào mạng.
Topology SAN fabric có các kiểu topology sau:
3.3.1. Director-Based Fabric.
Fabric thực hiện đơn giản nhất là Director Based Fabric. Fabric này gồm có một chuyển mạch chủ đơn lẻ với một số lượng cổng rất lớn (32, 64 hoặc 128 cổng phụ thuộc vào nhà sản xuất).
Một director-Based Fabric có các đặc điểm sau:
• Director-Based Fabric đưa ra một kiểu lưu trữ tập trung với tất cả thiết bị lưu trữ nối tới điểm duy nhất.
• Tất cả các cổng trong Fabric được sử dụng cho thiết bị, không có cổng nào được sử dụng cho liên kết các chuyển mạch.
• Nếu chuyển mạch chủ gặp sự cố, toàn mạng sẽ gặp sự cố. Kết quả, tất cả các server và thiết bị lưu trữ bị mất các kết nối.
• Topology Director-Based Fabric không có tính khả thi cao, một chuyển mạch chủ lớn không phải luôn luôn là một giải pháp đạt hiệu quả về chi phí. Khi có sự chuyển đổi về công nghệ sang các công nghệ mới hơn, toàn bộ chuyển mạch có thể cần phải được thay thế, thay vì chỉ thay thế các thành phần của mạng lưới (trong trường hợp nhiều chuyển mạch nhỏ hơn được sử dụng).
3.3.2. Topology chuyển mạch nối tầng (Cascaded Switch Topology).
Topology mạng đa chuyển mạch ít phức tạp nhất là topology chuyển mạch nối tầng (hình 5). Topology này bao gồm một số lượng tương đối nhỏ các chuyển mạch được liên kết với nhau theo kiểu tuyến tính.
Chuyển mạch cuối cùng của fabric cũng có thể được liên kết với chuyển mạch đầu tiên bằng cách sử dụng thêm một đường ISL (Inter-Switch Lịnk) tạo thành một topology ring. Topology chuyển mạch nối tầng có các đặc điểm:
• Sử dụng số lượng cổng tối thiểu để liên kết các chuyển mạch.
• Các chuyển mạch nối tầng không có chuyển mạch dự phòng (nếu chúng không được đưa vào vòng). Do đó, một chuyển mạch có sự cố sẽ dẫn tới fabric bị chia tách. Kết quả là các thiết bị được nối với một chuyển mạch này không thể truy nhập vào các thiết bị trên chuyển mạch khác.
3.3.3. Topology fabric lưới (Mesh Fabric Topology).
Topology fabric lưới (hình 6) bao gồm các chuyển mạch (3 đến 6 chuyển mạch) được nối với nhau dưới một số dạng hình học. Tất cả các chuyển mạch trong fabric được liên kết với nhau. Fabric cung cấp các đường nối dự phòng để đảm bảo mạng SAN vẫn sẽ hoạt động ngay cả khi một chuyển mạch đơn lẻ trong mạng gặp sự cố.
Topology Fabric lưới có thể được mở rộng bằng cách thêm các chuyển mạch khi cần thiết. Ngoài ra, topology này có một số lượng dự phòng bị giới hạn do các đường dẫn bổ sung giữa các chuyển mạch.
3.3.4. Topology SAN Building-Block Fabric.
Topology SAN Building - Block Fabric (hình 7) được dựa trên nhiều chuyển mạch nhỏ hơn (gọi là các building-block) được nối với nhau bằng cách sử dụng một đường trục (backbone) của một hoặc nhiều chuyển mạch.
Topology này dễ dàng thực hiện các mạng SAN có quy mô và số lượng cổng lớn. Mỗi building-block gồm các đường dẫn dự phòng và được cung cấp các kết nối chính xác với các chuyển mạch đường trục. Toàn bộ fabric có thể được thiết lập theo kiểu dự phòng.
Topology này có đặc điểm:
• Thực hiện đơn giản khi thiết lập một mạng SAN có quy mô lớn. Mạng SAN được thiết lập bằng cách đặt các building-block cùng với các chuyển mạch liên kết. Hình 8 minh họa một mạng SAN với 4 building - block được liên kết với nhau.
• Các chuyển mạch đường trục nối giữa các building-block với nhau có thể được sử dụng như là một điểm tập trung cho các thiết bị được sử dụng chung một cách thường xuyên (heavily shared device) như các ổ băng, thiết bị lưu trữ.
• Sử dụng nhiều cổng để liên kết các chuyển mạch gây ra sự lãng phí cổng.
3.3.5. Topology SAN Island.
Topology SAN Island do công ty BCS (Brocade Communications Systems) đưa ra. Topology này được sử dụng khi các phòng chức năng trong một trung tâm muốn có khả năng dùng chung một số thiết bị.
Topology SAN Island được thiết lập bằng cách sử dụng một chuyển mạch đường trục kết nối mạng SAN của các phòng trong trung tâm với nhau. Tất cả các thiết bị dùng chung như các ổ băng từ và các thiết bị lưu trữ khác đều được nối với chuyển mạch đường trục. Bằng cách chia vùng, các mạng SAN ở các phòng tùy theo nhu cầu, có thể được bảo vệ khỏi sự truy nhập từ bên ngoài hoặc được thiết lập để dùng chung. Hình 9 minh họa 3 mạng SAN được liên kết với nhau sử dụng topology SAN Island.
3.3.6. Mạng Metropolitan và Wide Area SAN.
Mạng Metropolitan Area SAN sử dụng để kết nối các mạng SAN ở phạm vi vùng (khoảng cách tới 100km). Khi thực hiện mạng Metropolitan SAN, tiêu chuẩn Fibre channel được áp dụng bằng cách sử dụng bộ ghép kênh quang theo bước sóng (DWDM - Dense Wavelength Division Multiplexer). Những bộ DWDM được thiết lập ở biên giới của mạng để kết nối các mạng SAN với nhau. Các bộ DWDM có thể được liên kết với nhau tạo thành cấu trúc vòng (ring). Hình 10 minh hoạ mạng Metropolitan Area SAN sử dụng ba bộ DWDM.
Mạng Wide Area SAN sử dụng để kết nối các mạng lưu trữ trong các trung tâm lưu trữ ở phạm vi quốc gia (nationwide). Phương pháp phổ biến để thực hiện mạng Wide Area SAN là sử dụng Fibre Channel qua ATM (Assynchronous Transfer Mode) được truyền tải trên SONET (Synchronous Optical Network) hình 11.
3.4. Topology dự phòng.
Dự phòng cơ bản:
Dự phòng cơ bản trong mạng lưu trữ có thể được thực hiện bằng một số phương pháp khác nhau và được thực hiện ở hai mức cơ bản, hoặc ở mức thiết bị hoặc ở mức mạng.
• Thực hiện dự phòng ở mức thiết bị: Các thành phần thiết bị quan trọng trong mạng SAN có khả năng chuyển đổi nóng (hot-swappable) để quá trình thay thế thiết bị không phải tắt nguồn trên thành phần hỏng. Các thành phần thiết bị có thể được nhân đôi để sự hỏng hóc của thành phần đó sẽ không ảnh hưởng tới chỉ tiêu của thiết bị. Thành phần thiết bị được nhân đôi là nguồn cấp điện, bộ điều khiển kép cho các thiết bị RAID, đầu ra điện áp AC kép và hai quạt làm mát.
• Thực hiện dự phòng ở mức mạng: Các server được trang bị với các HBA kép để mỗi server có thể được nối với hai chuyển mạch khác nhau trong fabric. Một cách tương tự, các khối lưu trữ có các cổng kép được nối tới hai chuyển mạch khác nhau trong fabric. Bằng cách này, sự hỏng hóc của một chuyển mạch trong fabric sẽ không gây ra sự mất truy nhập vào server và các khối lưu trữ nối với nó. Nhiều đường dẫn cũng được thiết lập trong fabric để bảo đảm vẫn có các đường dẫn giữa các chuyển mạch khi chuyển mạch trên đường ngắn nhất bị sự cố. Trong trường hợp cần thiết, toàn bộ mạng kết nối có thể được nhân đôi để tạo thành một sự dự phòng hoàn toàn và mạng chống lỗi .
Topology Remote mirroring:
Topology Remote mirroring bổ sung một mức dự phòng khác và thậm chí tốt hơn về mặt thời gian chuyển đổi từ thiết bị chính sang dự phòng so với các cấu hình dự phòng đơn giản vì topology này không phụ thuộc vào một vị trí đơn lẻ.
Các cấu hình dự phòng đơn giản ở mức thiết bị và mức mạng cho dù hoạt động tốt nhưng vẫn nhạy cảm với một số thảm họa như lửa, động đất và các thiên tai khác. Những thảm hoạ này có thể làm tê liệt mạng và có thể phá hủy dữ liệu. Các cấu hình Remote Mirroring (hình 12) cung cấp khả năng chịu được thảm hoạ hoàn toàn bằng cách thiết lập một bản sao (duplicate) của mạng SAN tại vị trí cách xa.
Tất cả các khối lưu trữ ở mạng chính cũng như đường trục đều được nhân đôi. Vì có một lưu lượng dữ liệu tương đối lớn truyền giữa mạng cục bộ và mạng ở xa, do đó cần thiết có nhiều đường dẫn nối giữa chúng. Hai mạng được nối với nhau có thể sử dụng sợi quang đơn mode cho phép khoảng cách truyền dẫn lên tới 70km qua các chuyển mạch được nối tầng hay tới 10km sử dụng chuyển mạch đơn lẻ.
Một lựa chọn khác để thực hiện cấu hình remote mirroring là cung cấp kết nối từ xa qua mạng WAN (Wide Area Network). Khi đó, khoảng cách giữa hai mạng sẽ còn lớn hơn. Một số các tuỳ chọn khác nhau cho đường nối từ xa WAN gồm có ATM hoặc IP qua SONET (hình 13).
Các bài viết khác