Наша сеть партнеров Banwar
Що зазвичай знають про RAID 5? Відмінний універсальний представник RAID-масивів, що має деякі обмеження щодо ємності.
При використанні стандартних RAID-контролерів (Adaptec, LSI і т.п.) максимальна кількість дисків в RAID 5 становить 32. Зараз вже є по-справжньому великі диски (HGST 10tb, корисна ємність дорівнює 9313 Гігабайт / 9,1 Терабайт). Взявши 32 таких диска по 10 Тбайт, отримаємо RAID 5 з 281,8 Тбайт корисного об'єму. При цьому обсяг, рівний одному з дисків RAID 5, буде витрачено на контрольні суми для забезпечення відмовостійкості.
Такого обсягу домашній сервер цікавить небагатьох. Однак з величезними масивами архівних, статистичних та великомасштабних даних все активніше працюють компанії, тому не виключено, що комусь буде потрібно і такий монстр.
Навіть якщо взяти більш реальний варіант, коли великий сервер створюють з менших дисків, тому що великі занадто дорогі, принципи створення такого сервера залишаться тими ж.
Звернемося до проблем масиву на 32 диска по 10 Тбайт.
Основні питання пов'язані з побудовою (build) і відновленням (rebuild) RAID. Розглянемо деякі показники для контролера, що працює з дисками такого обсягу в подібному масиві.
- Розмір блоку даних (на диск, так званого малого Страйп) - 256 Кбайт.
- Кількість блоків на одному диску - 38 146 972.
- У великій блок (великий страйп, що проходить через всі диски масиву) входить 32 елемента по 256Кбайт (8 Мбайт).
- Для запису однієї контрольної суми RAID-масиву потрібно буде прочитати дані з 31 диска, прорахувати контрольну суму і записати на 1 диск - по блокам.
- Множимо на 38 мільйонів блоків.
Навантаження на диски виходить дуже високою - через це підвищується ймовірність виходу з ладу ще одного диска і всього масиву.
Проблема в тому, що в операції задіяні всі 31 диск. З одного боку, це непогана потоковая швидкість читання, з іншого - тривале перестроювання. Щоб перебудувати масив за 24 години, диски повинні зчитувати / записувати дані зі швидкістю як мінімум 115 Мбайт / с. І хоча зараз диски SATA і SAS вже близькі до таких показників зчитування, до відповідної швидкості запису досить далеко, тому на перебудову піде набагато більше доби.
Якщо в процесі перебудови RAID 5 відмовить ще один диск - доведеться звертатися в компанію з відновлення даних .
Вихід - організація RAID 50 - комбінації масивів RAID 5, об'єднаних в RAID 0 .
Розглянемо принципи роботи такого масиву. У стандартному RAID 0 з групи одиничних дисків формують швидкий масив, де окремі диски виступають його учасниками. При цьому кожен з них нічим не захищений - RAID 0 не передбачає відмовостійкості , Яка реалізується подвійним зберіганням блоків даних в RAID1 / RAID10 або контрольними сумами в RAID5 / RAID6. Якщо один з дисків вийде з ладу, результатом стане відмова всього масиву.
У масиві RAID 50 кожен з учасників RAID 0 верхнього рівня являє собою масив RAID 5. Тому при відмові диска учасник не виходить з ладу, як у випадку з RAID 0, а просто працює трохи повільніше, оскільки масив змінює статус на «degraded».
Наведені вище розрахунки залишаються тими ж для окремих дисків, зате кількість дисків у великому блоці масиву стає істотно нижче (як мінімум наполовину), тому зростає швидкість у всіх зонах.
Чомусь вважається, що учасників верхнього рівня для масивів RAID 10, 50 і 60 може бути тільки два. Насправді, в зазначених змінах RAID це кількість вибирається - 2, 3, 4. Як правило, чим їх більше, тим краще. З цією інформацією повернемося до конфігурації на 32 диска.
Замість того, щоб збирати 32 диска в один масив RAID 5, створимо RAID 50 з двох RAID 5 по 16 дисків з RAID 0 верхнього рівня. Загальна ємність буде на один диск менше, зате істотно виростуть і продуктивність, і швидкість перестроювання.
Покажемо це. На практиці виявляється, що 32 дисків занадто багато для ефективної роботи алгоритму RAID 5. За швидкістю такий варіант поступається оптимальному - RAID 5 на 8-16 дисків. Тому RAID 5 на 16 дисків завжди швидше тієї ж конфігурації на 32 диска. А у нас тепер два масиви RAID 5, об'єднаних в один.
Переваг відразу кілька. Під час перешикування RAID (при відмові диска) задіяні лише 16 з 32 дисків. Друга половина RAID 50 (ще 16 дисків в масиві RAID 5) в процесі участі не бере. Тому перестроювання йде набагато швидше, а продуктивність масиву в цілому не страждає так, як у випадку з RAID 5 з 32 дисків.
Недоліки RAID 50 в порівнянні з єдиним великим масивом RAID 5: за двох учасників масиву верхнього рівня втрачається обсяг ще одного диска.
Аналізуючи конфігурації RAID 50/60, спираємося на математику. Розглянемо кілька варіантів.
RAID 50 з трьома учасниками на 32 диска - не реалізується. Оптимальний варіант RAID 50 на трьох учасників-30 дисків (3 учасники по 10). Корисна ємність складе 27 дисків, зате масив буде (а) швидше і (б) досить швидше в перестроюванні, ніж будь-яка з розглянутих вище конфігурацій.
RAID 50 на 32 диска з чотирма учасниками - реалізується. 4 диска доведеться виділити під контрольні суми. При цьому кожен масив RAID 5 (кожен учасник) матиме 8 дисків і відмінну скорость.Сістема володіє фантастичною продуктивністю. Немає претензій і до швидкості перестроювання, а її вплив на сервер зведено до мінімуму. Недоліки - вартість вище, а ємність трохи нижче.
Отже, RAID 50 - це завжди компроміс: чим більше учасників верхнього рівня, тим вище витрати і менше ємність, зате помітно зростає продуктивність. (Що з 32 дисками зробив би автор? Масив RAID 50 на 30 дисків і 3 учасники, а два останніх диска залишив би в якості резервних з гарячою заміною).
Відповімо на питання, винесене в заголовок. Наскільки і коли доцільно використання RAID 50? RAID 50 на великій кількості дисків великого обсягу - надійніше, ніж RAID 5, і економічніше, ніж RAID 10.
Що зазвичай знають про RAID 5?Що з 32 дисками зробив би автор?
Наскільки і коли доцільно використання RAID 50?