Chủ Nhật, 30 tháng 11, 2014

Tìm hiểu về mạng lưu trữ riêng biệt SAN (Storage Area Networks)

Trong thời đại hiện nay, hoạt động và sự thành công trong hoạt động của hầu hết các doanh nghiệp/cơ quan/tổ chức (sau đây gọi chung là doanh nghiệp - DN), phụ thuộc rất nhiều vào hạ tầng công nghệ thông tin (CNTT) của họ. Xét trên khía cạnh IT, cốt lõi cơ bản trong hoạt động của các doanh nghiệp là các quá trình lưu trữ, xử lý và trao đổi dữ liệu, thông tin. Liên quan đến các quá trình này, và cũng là một trong những thành phần quan trọng bậc nhất của cơ sở hạ tầng thông tin là hệ thống lưu trữ. Khái niệm "hệ thống lưu trữ" chỉ đến tập hợp của tất cả các tài nguyên sử dụng cho mục đích lưu trữ dữ liệu của hệ thống, bao gồm:
- các thiết bị lưu trữ, như ổ đĩa cứng trong của các máy chủ, các tủ đĩa ngoài, các thiết bị băng từ
- các phần mềm quản lý, điều khiển hoặc cung cấp tính năng phụ trợ (như sao chép, sao lưu vv..) cho các thiết bị lưu trữ,
- các giao thức và phụ kiện cho kết nối và trao đổi dữ liệu giữa các thiết bị lưu trữ.
Để hoạt động trên nền tảng IT của DN được thông suốt và hiệu quả, hệ thống lưu trữ cần được thiết kế và vận hành với sự quan tâm cao, được đầu tư xứng đáng cả về giá trị kinh tế và về công nghệ kỹ thuật. Tất cả các dữ liệu cần thiết cho quá trình hoạt động của DN phải được lưu trữ đầy đủ (yêu cầu đủ về dung lượng), với độ an toàn và tính bảo mật cao, cho phép truy xuất với tốc độ nhanh, được sử dụng và xử lý một cách hiệu quả và hợp lý (yêu cầu về hiệu năng và quản trị lưu trữ).
Đáp ứng những yêu cầu như trên, ngành công nghệ lưu trữ đang có một lộ trình phát triển nhanh chóng với nhiều bước tiến mới về công nghệ nhằm nâng cao giá trị và hiệu quả sử dụng của hệ thống lưu trữ. Theo dõi tình hình nghiên cứu và triển khai thực tế, có thể thấy xu thế phát triển hiện nay của công nghệ lưu trữ đang tập trung vào các điểm nóng như sau:
- sử dụng mạng lưu trữ riêng biệt, tốc độ cao cho mục đích lưu trữ dữ liệu (SAN: Storage Area Network)
- phân mức tầm quan trọng của dữ liệu, trên cơ sở đó dùng thiết bị và công nghệ lưu trữ phù hợp, giảm thiểu chi phí đầu tư và vận hành. Nguyên lý lưu trữ phù hợp với tầm quan trọng của dữ liệu có thể được áp dụng là phân mức lưu trữ (Tiered-Storage), và quản lý lưu trữ theo vòng đời dữ liệu (ILM: Information Lifecycle Management)
- tiến hành hợp nhất hệ thống lưu trữ theo phương pháp ảo hóa (Storage Virtualization), nâng cao hiệu quả sử dụng.
Trong các phần tiếp theo, bài viết sẽ giới thiệu và phân tích các hướng công nghệ nói trên.
1. Các hướng công nghệ nâng cao giá trị và hiệu quả sử dụng của hệ thống lưu trữ
1.1. Mạng lưu trữ riêng biệt SAN (Storage Area Networks)
Xét tổng quan về phương diện kết nối, điểm khởi đầu của quá trình phát triển công nghệ lưu trữ (Hình 1) là khi các máy tính và máy chủ nhỏ được trang bị các ổ đĩa trong của riêng chúng. Với cách lưu trữ này, dung lượng lưu trữ không được lớn, thường chỉ có khả năng đáp ứng nhu cầu của người sử dụng đầu cuối. Khả năng mở rộng dung lượng, công nghệ bảo vệ tính toàn vẹn của dữ liệu (cụ thể là công nghệ RAID: Redundant Array of Independent Disks, cho phép phục hồi nguyên vẹn dữ liệu khi ổ đĩa cứng bị hỏng) còn rất hạn chế.
Bước phát triển tiếp theo là khi máy tính/máy chủ có kết nối riêng đến thiết bị lưu trữ bên ngoài của mình (có thể là đĩa cứng hoặc băng từ) qua đường kết nối hoạt động theo giao thức SCSI (Small Coumpter System Interface). Mỗi máy tính/máy chủ chỉ có quyền kiểm soát, quản trị thiết bị lưu trữ ngoài của chính mình. Với cách kết nối và quản lý cục bộ như vậy, rất khó có thể xây dựng được những hệ thống dữ liệu có dung lương cao, chưa nói đến việc không có được khả năng quản trị tập trung từ xa.
Một hướng phát triển khác là khi thiết bị lưu trữ được thiết kế để dữ liệu trên đó có thể được truy nhập qua mạng LAN thông thường. Điển hình là các thiết bị NAS (Network Attached Storage) chứa dữ liệu tập trung và cho phép chia sẻ dữ liệu ở mức file. Mặc dù đã phần nào giải quyết được vấn đề dung lượng và quản lý tập trung, nhưng việc truyền tải dữ liệu giữa thiết bị có nhu cầu sử dụng và thiết bị lưu trữ xảy ra trên hạ tầng mạng LAN thông thường, dùng giao thức mạng TCP/IP, gây hạn chế tốc độ truyền tải, dẫn đến hiệu năng hoạt động của cả hệ thống không được cao.
Những nhược điểm về tốc độ về hiệu năng được đẩy lùi trong bước phát triển tiếp theo với sự xuất hiện của công nghệ thiết lập mạng lưu trữ riêng biệt SAN (Storage Area Network). Mặc dù có thể tận dụng hạ tầng mạng IP để truyền tải luồng dữ liệu của mạng lưu trữ, điển hình là sự phát triển của các giao thức như iSCSI (Internet SCSI), FCIP (Fibre Channel over IP), iFCP (Internet Fibre Channel Protocol), nhưng những giao thức này chưa thật sự có được sự triển khai rộng rãi trong thực tế. Do đó, bài viết sẽ tập trung vào xu hướng công nghệ phổ biến nhất là mạng SAN sử dụng công nghệ quang FC (Fibre Channel), thường được nhắc đến với tên gọi FC SAN.
Hình 1: Các bước phát triển của công nghệ lưu trữ (từ trái qua phải): Lưu trữ cục bộ.
Lưu trữ tập trung, truy cập qua mạng LAN; Mạng lưu trữ riêng (SAN)
Vậy thế nào là mạng FC SAN? Thành phần của một mạng lưu trữ FC SAN bao gồm các thiết bị lưu trữ (tủ đĩa, thiết bị băng từ), các máy chủ sử dụng dữ liệu, và các bộ chuyển mạch SAN switch. Kết nối vật lý cơ bản trong một mạng FC SAN đơn giản được minh họa trong Hình 2.
Hình 2: Kết nối vật lý cơ bản của mạng FC SAN.
Cũng có thể nhìn một mạng SAN theo cách phân chia logic thành 3 lớp: Host layer, Fabric layer và Storage layer như hiển thị trong Hình 3. Host layer chứa các máy chủ chạy các ứng dụng có sử dụng dữ liệu được lưu trữ trong mạng SAN. Fabric layer chứa các bộ chuyển mạch SAN switch. Storage layer chứa các thiết bị lưu trữ như tủ đĩa ngoài và thiết bị băng từ.
Hình 3: Phân chia lớp trong mạng SAN.
Mạng SAN có quy mô càng lớn thì số lượng các thiết bị và kết nối (máy chủ, switch, tủ đĩa, thiết bị băng từ) sẽ càng nhiều. Mặc dù vậy, cấu trúc logic tổng quan 3 lớp (host layer, fabric layer, storage layer) như trong Hình 3 là không thay đổi.
Sử dụng mạng lưu trữ FC SAN mang lại những lợi ích chính sau:
Tăng hiệu năng hoạt động: Hiệu năng của hệ thống lưu trữ, và theo đó là của cả hệ thống IT được tăng lên đáng kể. Một mặt, tốc độ truyền tải trong mạng SAN với sự sử dụng công nghệ quang đạt đến tốc độ 4Gbps, giảm thời gian truy cập dữ liệu trong các quá trình sử dụng, sao lưu, phục hồi. Mặt khác, với mạng lưu trữ riêng SAN, luồng dữ liệu trong mạng LAN thông thường dùng giao thức mạng TCP/IP không còn cần phải chia sẻ đường truyền có dung lượng giới hạn với luồng dữ liệu của hệ thống lưu trữ, sao lưu. Sự tách rời riêng biệt này tối ưu hoá hoạt động của cả 2 mạng LAN và SAN.
Tăng tính linh hoạt của hệ thống lưu trữ: Sử dụng mạng SAN đem lại tính linh hoạt cao cho hệ thống lưu trữ. Các giao thức và công nghệ chuẩn dùng trong mạng SAN cho phép sử dụng nhiều chủng loại thiết bị lưu trữ của các nhà sản xuất khác nhau, khi họ cùng tuân thủ các chuẩn công nghiệp. Dung luợng lưu trữ trong mạng SAN có thể được sử dụng bởi nhiều máy chủ, nhiều ứng dụng khác nhau. Dung lương lưu trữ của cả mạng SAN có thể được mở rộng, nâng cấp dễ dàng. Hơn thế nữa, mạng SAN mở ra khả năng hợp nhất tài nguyên lưu trữ, nâng cao hiệu suất sử dụng của hệ thống lưu trữ, cho phép vận hành và quản lý hiệu quả hơn.
Giảm chi phí sở hữu (Totalcost of Ownership): đối với những DN có nhiều dữ liệu, mặc dù chi phí đầu tư ban đầu để xây dựng mạng SAN có thể lớn hơn chi phí xây dựng hệ thống lưu trữ thông thường, nhưng xét về tầm xa thì SAN là sự đầu tư hợp lý có chí phí sở hữu (bao gồm vận hành, quản lý, và bảo quản) không cao. Thứ nhất, sử dụng mạng SAN sẽ mở ra khả năng quản lý mềm dẻo, linh hoạt, và đơn giản, do đó giảm thiểu chi phí quản lý, quản trị. Thứ hai, mạng SAN còn hỗ trợ nhiều tính năng thuận lợi khác trong quá trình sử dụng (như hợp nhất lưu trữ, hỗ trợ phục hồi dữ liệu nhanh chóng sau sự cố, thảm hoạ...), làm tăng hiệu quả hoạt động của hệ thống, xứng đáng với chi phí đầu tư ban đầu.
1.2. Lưu trữ dựa trên nguyên lý phân mức tầm quan trọng của dữ liệu
1.2.1. Tiered-storageÝ tưởng để xây dưng hệ thống lưu trữ theo môi trường phân mức (tiered-storage) bắt nguồn từ sự nhận thức và nhu cầu tiết kiệm chi phí hoạt động. Sẽ là lãng phí cho giá thành đầu tư và vận hành nếu mặc định rằng tất cả các dữ liệu đều quan trọng như nhau và do đó cần được lưu trữ bằng các thiết bị và công nghệ có giá thành cao giống nhau. Để tiết kiệm chi phí đầu tư và chi phí hoạt động, cách tốt hơn là lưu trữ dữ liệu theo cách và bằng thiết bị phù hợp với giá trị của chính nó. Tiêu chí để đánh giá giá trị của dữ liệu, hay nói cách khác tiêu chí để phân loại dữ liệu có thể là hiệu quả hoạt động do dữ liệu mang lại; tần suất được truy cập và sử dụng của dữ liệu; mức độ an toàn, bảo mật cần thiết cho dữ liệu; và một số các tiêu chí khác, tùy vào từng hệ thống cụ thể.
Trước đây, trong các hệ thống lưu trữ truyền thống, việc phân chia thành 2 mức lưu trữ dữ liệu on-line và off-line là rất phổ biến. Dữ liệu dành cho các ứng dụng yêu cầu tính sẵn sàng cao, tốc độ hoạt động nhanh, cần truy cập nhiều sẽ được lưu trữ trên các thiết bị lưu trữ được sản xuất theo tiêu chí tối ưu hoá cho tốc độ hoạt động. Các thiết bị lưu trữ này có giá thành, chi phí quản lý, bảo quản và vận hành cao. Đây là mức lưu trữ on-line.
Mức lưu trữ off-line dành cho các dữ liệu ít được sử dụng. Dữ liệu trong trường hợp này được chứa trên các băng từ, một phương pháp rẻ tiền hơn nhưng lại làm chậm tốc độ truy nhập đến dữ liệu.
Thực tế là theo quá trình phát triển của CNTT, nhiều loại dữ liệu có tính chất nằm giữa 2 loại dữ liệu on-line và off-line ở trên. Các dữ liệu này không thật sự có yêu cầu quá cao về tính sẵn sàng, cũng như không phải là dữ liệu then chốt cho ứng dụng. Nhưng bên cạnh đó vẫn cần phải được truy cập và xử lý nhiều lần bởi người sử dụng. Ví dụ điển hình cho loại dữ liệu này là các tập tin (file) có mức quan trọng không cao (như tranh ảnh giải trí) được nhiều người truy cập. Vì thế loại dữ liệu này được xếp vào một mức lưu trữ mới, gọi là mức near-line.
Ý tưởng tiered-storage với 3 mức on-line, near-line, off-line không phải hoàn toàn mới. Tuy nhiên điều đáng nói là sự xuất hiện của các công nghệ ổ đĩa lưu trữ mới đã cho phép việc triển khai thực tế của 3 mức lưu trữ trở nên khả thi. Công nghệ lưu trữ được sử dụng hiện nay cho mức on-line là các thiết bị hoạt động với các ổ đĩa quang FC (tốc độ đọc/viết nhanh) hoặc SCSI, SAS (Serial Attached SCSI). Các ổ đĩa SATA (Serial ATA) hoặc FATA (Fibre Channel ATA) được dùng cho mức near-line và các băng từ được sử dụng cho mức off-line (Advanced Technology Attachment (ATA), còn được biết đến với tên gọi Intelligent Drive Electronics (IDE), là chuẩn của các ổ đĩa cứng được dùng trong máy tính cá nhân) . Hình 4 trình bày sự so sánh mang tính định hướng về giá thành giữa các mức lưu trữ dữ liệu. Có thể thấy, khi chuyển từ dùng các thiết bị với ổ đĩa FC sang ổ đĩa SATA và ổ băng từ, chi phí sở hữu (đầu tư và vận hành, bảo quản) tính theo đơn vị dung lượng GigaByte có thể giảm xuống nhiều lần, đem lại mức chênh lệch rất lớn. Tuy nhiên sự giảm chi phí sở hữu có được là do các chỉ số về hiệu năng của từng công nghệ ổ đĩa giảm dần theo thứ tự ổ đĩa FC, SATA và FATA. Hiệu năng của ổ đĩa cứng (Bảng 1) được đánh giá dựa vào các yếu tố dung lượng, tốc độ quay (càng cao càng tốt vì tỷ lệ thuận với tốc độ đọc dữ liệu), thời gian trung bình để đọc/ghi dữ liệu, tốc độ truyền tải dữ liệu tối đa. Cũng vì vậy, khi chọn lựa mức lưu trữ phù hợp cho dữ liệu, cần cân nhắc giữa mức quan trọng của dữ liệu, chi phí đầu tư cho phép và các chỉ số hiệu năng của từng loại ổ đĩa. Tất nhiên việc phân loại giá trị của dữ liệu để xác định mức lưu trữ phù hợp mang tính chủ quan, phụ thuộc vào tính chất hoạt động của từng DN và vào từng trường hợp cụ thể.
Hình 4: So sánh các mức lưu trữ on-line, near-line và off-line
Bảng 1: So sánh hiệu năng các công nghệ ổ đĩa cứng


SATA

FATA

FC

FC tốc độ cao

Dung lượng (capacity) / 1 đĩa

250, 500 GB

500 GB

73, 146, 300 GB

73, 146 GB

Tốc độ quay (Rotational speed)

7,200 rpm (rotation per minute)

7,200 rpm

10,000 rpm

15,000 rpm

Thời gian đọc trung bình (Average Read)

8.5 ms

8.5 ms

4.9 ms

3.5 ms

Thời gian ghi trung bình
(Average Write)

9.5 ms

9.5 ms

5.5 ms

4.0 ms

Tốc độ truyền tối đa (Max. sustained data transfer rate)

34-59 MB/sec

34-59 MB/sec

39 – 80 MB/s

58 – 96 MB/s


1.2.2 Quản lý vòng đời dữ liệu (Information Lifecycle Management)
Cùng với xu hướng phân mức lưu trữ tiered-storage là xu hướng tiến tới phương thức quản lý dữ liệu theo vòng đời của chúng, hay còn gọi là ILM (Information LifeCycle Management). ILM quản lý việc lưu trữ dữ liệu hợp lý tùy theo mức độ quan trọng và tùy theo từng thời điểm trong vòng đời của dữ liệu. Tầm quan trọng của dữ liệu trước hết phụ thuộc một cách chủ quan vào đối tượng sử dụng. Ví dụ trong một DN, đối với bộ phận nhân sự, bản danh sách chứa bảng lương cụ thể và cập nhật của tất cả các nhân viên trong DN có tầm quan trọng cao hơn hẳn so với thông tin hồ sơ của các cá nhân. Mặt khác, cùng một dữ liệu nhưng tại mỗi thời điểm khác nhau, nhu cầu sử dụng và truy cập, và theo đó là tầm quan trọng của dữ liệu sẽ khác nhau. Ví dụ văn bản (có giá trị thi hành theo từng năm) quy định mức độ đãi ngộ và bảo hiểm y tế của nội bộ công ty trong năm hiện tại, sẽ được nhiều nhân viên truy cập rất nhiều lần trong năm đó, nhưng 10 năm sau sẽ hầu như không được truy cập đến nữa.
Hình 5: Tầm quan trọng của dữ liệu thay đổi theo thời gian
Hình 5 cho thấy mức độ quan trọng của dữ liệu, theo các thể loại email, kinh doanh, nghiên cứu, quảng bá, đều thay đổi theo dòng thời gian. Đồng thời Hình 5 cũng đề xuất các mức lưu trữ phù hợp gán cho dữ liệu trong từng thời điểm. Có thể thấy, tầm quan trọng của dữ liệu kinh doanh thể hiện sự biến thiên theo đường hình sin (đường màu đỏ) trong một giai đoạn nhất định. Trong giai đoạn này, on-line hoặc near-line là phương thức lưu trữ hợp lý. Sau một thời gian, mức quan trọng của dữ liệu kinh doanh giảm dần một cách rõ rệt và khi đó nên được lưu trữ dưới dạng off-line, trước khi bị hủy bỏ hoàn toàn. Tầm quan trọng của dữ liệu thư điện tử (email) giảm nhanh chóng theo thời gian (đường màu vàng). Sự biến thiên cho các dữ liệu thể loại nghiên cứu, quảng cáo cũng có thể suy ra dễ dàng từ Hình 5. Tại mỗi thời điểm, dữ liệu sẽ được lưu trữ tại mức (on-line, near-line hay off-line) phù hợp với tầm quan trọng của chúng. Như vậy có thể thấy tiered-storage là một biện pháp hỗ trợ thực hiện ILM.
Theo các kết quả thống kê trong thực tế trên thể giới, lượng dữ liệu của một DN có mức tăng trưởng từ 30 đến 70% theo từng năm. Với tốc độ tăng trưởng như vậy, cùng với sự phân hoá mức quan trọng của dữ liệu như đã phân tích ở trên, sẽ là bất hợp lý và gây lãng phí lớn nếu tất cả dữ liệu được chứa ở mức on-line, mức có chi phí sở hữu cao nhất. Tăng chi phí quản lý, tăng độ phức tạp trong quản trị dữ liệu của hệ thống, tăng các chi phí vận hành là những nhược điểm của biện pháp lưu trữ dữ liệu chỉ ở cùng 1 mức on-line.
ILM giải quyết vấn đề xác định đúng vị trí (mức) cần được lưu trữ của dữ liệu và giải quyết việc chuyển đổi vị trí dữ liệu khi cần thiết. Các quá trình xác định và chuyển đổi vị trí như vậy sẽ được tiến hành một cách tự động, tuân thủ theo những nguyên tắc được người quản trị hệ thống thiết lập sẵn.
Áp dụng ILM mang lại những lợi ích cơ bản như sau:
- tạo phương pháp quản lý và kiểm soát được hệ thống lưu trữ dữ liệu cũng như quản lý và kiểm soát chi phí cho lưu trữ,
- tăng độ linh hoạt cho hệ thống lưu trữ,
- tự động hoá vị trí, mức lưu trữ cho dữ liệu phù hợp với yêu cầu, bắt đầu ngay từ thời điểm dữ liệu được tạo ra
- tăng hiệu quả sử dụng của hệ thống lưu trữ nhờ vào cách quản lý và kiểm soát tự động theo những quy tắc định trước
Nhìn nhận được tầm quan trọng của ILM, các hãng sản xuất thiết bị lưu trữ (như IBM, HP, EMC, SUN…) nói chung đều có sự đầu tư phát triển những sản phẩm phục vụ dịch vụ này. Mỗi hãng sản xuất đều đưa ra các sản phẩm quản trị nhất định cung cấp cho khách hàng tập hợp các tính năng ILM. Một mặt, tiered-storage, nhân tố quan trọng hỗ trợ thực hiện ILM, được hầu hết các hãng sản xuất hỗ trợ bằng cách cung cấp các dải sản phẩm thiết bị lưu trữ đa dạng (với các ổ đĩa FC, SAS, SCSI, SATA, băng từ). Mặt khác, các hãng còn cung cấp thêm những sản phẩm phần mềm, hoặc sản phẩm tích hợp phần cứng và phần mềm phục vụ mục đích ILM. Ví dụ hãng IBM có các sản phẩm như IBM TotalStorage SAN File System (sản phẩm tích hợp cả phần cứng và phần mềm, cho phép thiết lập một hệ thống tập tin (file system) chung trong mạng SAN để thực hiện một cách tự động các nguyên tắc lưu trữ dữ liệu), hoặc IBM Tivoli Storage Manager (sản phẩm phần mềm quản trị quá trình sao lưu, bảo tồn, hoặc sử dụng dữ liệu cho dịch vụ phục hồi thảm họa).1.3. Ảo hoá hệ thống lưu trữ (Storage Virtualization).
Như đã đề cập, lượng dữ liệu DN cần lưu trữ và sử dụng cho hoạt động của mình ngày càng tăng nhanh theo thời gian. Điều này đòi hỏi DN phải đầu tư, mua sắm các thiết bị lưu trữ để mở rộng và nâng cấp dung lượng khi có như cầu phát sinh. Do nhiều lý do khách quan như lịch sử hoạt động, năng lực đầu tư của DN tại thời điểm phát sinh nhu cầu, ảnh hưởng của hiện trạng công nghệ, của thị trường và thị phần lưu trữ tại thời điểm đầu tư vv…, tình trạng phổ biến là mỗi DN thường sở hữu nhiều loại thiết bị lưu trữ với dung lượng khác nhau, xuất xứ từ nhiều hãng sản xuất khác nhau, có nguyên lý hoạt động không giống nhau. Nói cách khác, hệ thống lưu trữ của DN mang nặng tính không đồng bộ, không thống nhất. Với thực trạng như vậy, bài toán đặt ra là phải làm thế nào để có thể sử dụng có hiệu quả nhất hệ thống lưu trữ đó?
Sáng kiến mang tính nền tảng để giải quyết cho bài toán ở trên là phải hợp nhất ở mức logic tất cả các dung lương lưu trữ trong hệ thống. Sao cho đối với người sử dụng, tất cả hệ thống lưu trữ được coi như một nguồn lưu trữ duy nhất mà trên đó người sử dụng có thể thực hiện các tác nghiệp về lưu trữ dữ liệu một cách thuận tiện. Việc giải quyết hợp nhất ở mức logic các thiết bị lưu trữ khác nhau về phiên bản, xuất xứ, nguyên lý hoạt động thành một nguồn lưu trữ duy nhất, chính là quá trình ảo hoá lưu trữ. Gọi là ảo hoá, vì người sử dụng sẽ chỉ nhìn thấy một nguồn lưu trữ duy nhất, trong khi thực tế về mặt vật lý thì không phải như vậy. Các thiết bị lưu trữ đã được ảo hoá, hợp nhất thành một nguồn lưu trữ chung. Người quản trị hệ thống sẽ có quyền điều khiển, quản lý nguồn lưu trữ được hợp nhất ở mức logic, tạo và sửa đổi vai trò của các thiết bị lưu trữ vật lý trong nguồn lưu trữ logic đó.
Ảo hoá lưu trữ thường được thực hiện bởi các phần mềm chuyên dụng. Phần mềm chuyên dụng có thể được cài đặt và tích hợp trực tiếp trên các máy chủ chạy ứng dụng của hệ thống hoặc cũng có thể cài đặt/tích hợp trên thiết bị lưu trữ. Tuy nhiên, xu hướng hiện nay là ảo hoá được thực hiện trong mạng SAN, trong đó phần mềm chuyên dụng được cài đặt vào các bộ chuyển mạch hoặc các máy chủ chuyên dụng. Trong các sản phẩm có mặt trên thị trường, nổi bật có thế nhắc đến SVC (SAN Volume Controller) của hãng IBM. Sản phẩm này bao gồm phần mềm ảo hóa chuyên dụng cùng với các máy chủ nền tảng x86 chạy trong chế độ chia sẻ tải (cluster), dùng để cài đặt phần mềm ảo hóa (Hình 6). Một ví dụ khác là sản phẩm phần mềm ảo hoá lưu trữ Invista của hãng EMC được cài đặt trực tiếp trên các SAN switch.
Áp dụng ảo hoá lưu trữ mang lại những lợi ích cơ bản sau:
Đơn giản hóa việc quản lý hạ tầng lưu trữ: việc quản lý duy nhất 1 nguồn lưu trữ ảo sẽ đơn giản hơn cho người quản trị. Thay vì phải thao tác các công việc quản lý tại chỗ cho từng thiết bị riêng biệt trong mạng SAN, nguời quản trị sẽ quản lý tập trung từ 1 địa điểm. Với cách quản lý tập trung như vậy, việc di chuyển dữ liệu trong mạng SAN từ thiết bị này sang thiết bị khác khi có nhu cầu sẽ được xử lý nhanh chóng và thuận tiện hơn rất nhiều. Hơn nữa, ứng dụng chạy trên các máy chủ không cần phải ngừng hoạt động khi thực hiện việc di chuyển dữ liệu.
Góp phần nâng cao hiệu quả sử dụng dữ liệu: ảo hoá dữ liệu góp phần làm tăng tính sẵn sàng của dữ liệu, hỗ trợ khả năng quản lý dữ liệu theo vòng đời. Các khả năng như vậy góp phần làm tăng hiệu quả sử dụng của cả hệ thống lưu trữ.
Hình 6: Mô hình chức năng của sản phẩm ảo hoá lưu trữ IBM SVC2.
Kết luận.
Nhu cầu sử dụng hệ thống lưu trữ dữ liệu một cách có hiệu quả luôn là nhu cầu thực tế của các DN có hoạt động dựa trên nền tảng số hóa và công nghệ thông tin. Nhu cầu này càng trở nên cấp thiết khi tốc độ tăng trưởng theo từng năm của dữ liệu rất nhanh, cả về dung lượng (đến 30-70%) và cả về độ phức tạp. Những yếu tố đó là tiền đề dẫn đến các hướng phát triển công nghệ nhằm mục đích nâng cao giá trị và hiệu quả sử dụng của hệ thống lưu trữ. Bài viết đã trình bày về 3 xu hướng chính, bao gồm:
- thiết lập mạng lưu trữ riêng trên nền tảng công nghệ quang (Fibre Channel Storage Area Network FC SAN),
- phân loại tầm quan trọng của dữ liệu bằng nguyên lý phân lớp (tiered-storage) và quản lý vòng đời dữ liệu (Information Lifecycle Management ILM), từ đó chọn thiết bị và vị trí lưu trữ phù hợp
- ảo hóa hệ thống lưu trữ dữ liệu (Storage Virtualization)

Tại Việt Nam trong thời điểm hiện nay, thị trường về hệ thống lưu trữ cho thấy nhu cầu lớn nhất chủ yếu đang là xây dựng những mạng SAN quy mô nhỏ và vừa. Trong khi tại các nước phát triển, việc áp dụng các công nghệ tiered-storage, ILM, và ảo hóa lưu trữ đã bắt đầu được đẩy mạnh, thì tại Việt Nam chúng chưa thật sự có được sự quan tâm lớn. Lý do là thị trường Việt Nam còn ít những mạng SAN quy mô lớn và phức tạp, dẫn đến chưa có nhu cầu thực tế cao cho ảo hoá và quản lý vòng đời dữ liệu. Tuy vậy, như đã nhắc đến ở trên, tốc độ tăng trưởng của dữ liệu của các DN là rất nhanh, và Việt Nam không nằm ngoài diễn biến chung này. Vì vậy trong những năm tới, chắc chắn tất cả các xu hướng công nghệ được trình bày trong bài viết sẽ ngày càng được áp dụng rộng rãi tại Việt Nam, mang lại hiệu quả cao hơn cho hoạt động của các DN.

0 nhận xét:

Đăng nhận xét