Протоколы схд
Сегодня проблемы производительности в контексте хранения информации все еще актуальны для некоторых типов реализации хранилищ. Для систем хранения данных (СХД) данная проблема практически неактуальна, поскольку инфраструктура обеспечивает достаточную производительность. Однако сети хранения данных (SAN) пока не способны обработать такие объемы данных.
Распространенные протоколы хранения
Для правильной организации обмена данными между отдельными элементами хранилища и пользовательскими устройствами могут использоваться различные протоколы:
- Fibre Channel. Протокол передачи данных, ориентированный на SAN-архитектуру. Обеспечивается высокая скорость передачи данных, проверка наличия ошибок, восстановление данных.
- Обеспечивается возможность передачи SCSI-команд через сеть. Используется для подключения внешних хранилищ к серверам через Ethernet-сеть.
- Протокол для организации сетевой файловой системы. Клиентские устройства получают возможность подключаться к удаленной файловой системе для доступа к данным. Активно используется в современных системах распределенного хранения данных.
- Server Message Block (SMB) иCommon Internet File System (CIFS). Протоколы ориентированы на печать и обмен файлами через локальную сеть. Активно используются в сетях разного уровня.
- Параллельный SCSI. Протокол предназначен для обеспечения связи между серверами и внешними устройствами хранения данных. Обеспечивается низкая задержка сигнала и высокая передача данных.
- SAS. Новый последовательный протокол SCSI, реализует высокую скорость работы и надежность.
Протоколы имеют собственные особенности реализации, что позволяет подобрать оптимальный вариант с учетом потребностей. На выбор может повлиять требование к скорости, производительности, особенности используемой инфраструктуры, необходимый уровень надежности и защиты от внешних атак. Также компания должна сразу определить, кто будет обслуживать систему, поскольку определенные конфигурации требуют специальных навыков. Другие варианты, наоборот, предлагают простое обслуживание через привычный графический интерфейс.
Сравнение протоколов
Далее будет произведено сравнение протоколов по основным критериям. Это позволит упростить выбор с учетом набора факторов.
Производительность:
- SAS позволяет обеспечить высокую производительность, особенно при использовании прямого подключения к устройствам хранения данных.
- Parallel SCSI также имеет высокую производительность, но есть ограничения по количеству устройств и расстоянию между устройствами. При расширении платформы может наблюдаться падение производительности.
- CIFS/SMB – обеспечивается необходимый функционал для печати и доступа к файлам, однако для передачи данных производительности может быть недостаточно.
- NFS реализуется хорошая производительность для основных файловых операций. Хорошо подходит для систем сетевого хранения данных.
- Fibre Channel подходит для критической инфраструктуры. Стандарт позволяет реализовать необходимую производительность. Встроены механизмы отслеживания и устранения сбоев.
- iSCSI по сравнению с Fibre Channel имеет более низкую скорость работы, однако упрощает развертывание инфраструктуры.
Гибкость и масштабируемость:
- CIFS/SMB, NFS имеют ограничение на количество подключенных устройств и максимальный объем данных. Плохо подходят для сервисов с высокой нагрузкой.
- iSCSI, Fibre Channel, SAS обеспечивают хорошую масштабируемость, хорошо подходят для обслуживания большого количества устройств.
Простота управления и настройки:
- Fibre Channel, SAS, Parallel SCSI часто требуют наличия технического опыта для получения оптимальной конфигурации. При неправильной настройке производительность может сильно снизиться.
- iSCSI, CIFS/SMB, NFS предоставляют простой интерфейс для обслуживания системы. Поэтому данный вариант часто выбирают небольшие компании, которые обеспечивают настройку собственными силами.
Перед запуском собственной системы хранения данных необходимо заранее определить основные требования: необходимость расширения в дальнейшем, объем данных, дополнительные функции (например, создание резервных копий). Это избавит от необходимости разворачивать и настраивать новую инфраструктуру для расширения. Достаточно будет интегрировать в сеть новые узлы и обеспечить их настройку.
Протоколы объектного хранения
Наметилась тенденция роста популярности другого подхода к хранению данных – в виде отдельных объектов с собственным набором свойств. Они позволяют обеспечить высокую гибкость системы, масштабируемость и эффективность в процессе работы. Существует несколько распространенных протоколов данного типа, которые уже используются на практике:
- Объектно-ориентированный протокол, предназначенный для распределенных систем хранения данных. Используется во многих объектных хранилищах.
- Azure Blob Storage. Готовое решение от Microsoft, которое позволяет хранить данные в облаке и предоставляет удобный интерфейс для управления параметрами.
- GoogleCloud Storage. Решение от Google, в котором используется объектное хранение данных. Для взаимодействия с данными используется SDK Google Cloud и собственный API.
- Распределенное хранилище данных, для доступа к файлам используются протоколы Swift и S3.
Данные протоколы уже прошли определенный путь развития. Использование в реальных сервисах позволило выделить все недостатки, оптимизировать работу в разных режимах, улучшить производительность при высоких нагрузках.
Особенности хранения данных в сетях
Для распределенного хранения информации могут использоваться разные подходы для обмена информацией:
- Централизованная модель подразумевает, что вся информация хранится на центральных серверах. Внешние устройства могут использовать стандартные сетевые подключения для обмена данными (NFS, SMB и другие протоколы), также может быть реализован блочный доступ через iSCSI.
- Распределенная модель предусматривает хранение информации на разных устройствах. Используемые протоколы позволяют оптимизировать нагрузку на разные узлы, используя разные схемы доставки пакетов. Наибольшее распространение получили распределенные файловые (GlusterFS, Ceph,) и сети с объектным доступом (Swift, S3).
- Классические облачные хранилища позволяют хранить данные на внешнем сервере. Для доступа можно использовать веб-интерфейс, готовые приложения или возможности API. Встроены инструменты для корректировки основных параметров с учетом текущих задач.
- Кэширование данных позволяет организовать временное хранение часто используемых данных. Используется память с быстрым доступом, что позволяет снизить нагрузку на основные модули хранения данных.
- Важной составляющей системы является функция резервного копирования. В случае сбоя есть возможность оперативно восстановить данные, выбрав подходящую копию.
- Для хранения данных также могут использоваться устройства пользователей. За распределение отвечают соответствующие приложения.
Топология сетей
Определяется логическая и физическая структура сети, в которую входят устройства хранения данных. От выбранной схемы зависит максимальная производительность, отказоустойчивость, возможности масштабирования. На отказоустойчивость, к примеру, влияет возможность сохранения работоспособности при обрыве одного соединения. Обычно это реализуется за счет дублирования каналов связи между устройствами. Программное обеспечение фиксирует проблемы на линии и выбирает новый оптимальный маршрут. В этом случае восстановление работы может происходить без участия человека.
Наиболее распространены следующие топологии:
- Кольцевая топология. Все устройства соединены последовательно в виде кольца. Обеспечивается дополнительная отказоустойчивость, при разрыве соединения работоспособность сохраняется.
- Фабрика серверов. Сервера подключаются к хранилищам напрямую или через коммутаторы SAN. Такая инфраструктура предоставляет высокую пропускную способность и производительность.
- Звезда. Предусмотрен центральный элемент, к которому подключаются другие устройства. Простое управление и хорошая масштабируемость, но при возникновении сбоя в центральном узле работа нарушается во всей сети.
- Древовидная топология. Представляет собой объединение звезды и линейной топологии. Используется несколько центральных узлов, которые объединены между собой.
- Смешанная топология. Могут использоваться разные комбинации для обеспечения нужной производительности и надежности. К примеру, можно создать нужное количество звезд и объединить их в кольцо, используя преимущества обеих топологий. Потеря связи между звездами не приводит к потере работоспособности отдельного кластера, пакеты данных просто направляются по другому маршруту.
- Сеть хранения может быть построена на топологии «mesh», в котором каждое устройство напрямую соединяется с каждым элементом сети. Возможность выстраивать произвольные маршруты передачи данных обеспечивает высокую отказоустойчивость, однако стоимость реализации достаточно высока.
Выбор топологии зависит от бюджета, требований к отказоустойчивости, необходимости дальнейшего расширения.
Достоинства типов СХД
Успешно используются разные типы систем хранения данных. В каждом случае есть свои преимущества, недостатки и особенности эксплуатации.
Сетевое хранилище NAS:
- Стоимость запуска и обслуживания заметно ниже.
- Легко расширяется, есть возможность обеспечения совместного доступа к файлам.
- Простая организация доступа через внешнюю сеть.
Хранилище с подключением SAN:
- Встроенные механизмы резервного копирования, быстрое восстановление данных.
- Несколько устройств могут одновременно записывать и считывать данные.
- Высокая производительность, минимальная задержка при отправке запроса.
Облачные хранилища данных:
- Отпадает необходимости в обслуживании оборудования.
- Резервное копирование по расписанию.
- Масштабирование осуществляется через программный интерфейс.
Объектное хранилище данных:
- Защита данных, шифрование и репликация.
- Высокая скорость работы за счет протоколов объектного доступа.
- Эффективное управление и масштабируемость.
Нет возможности однозначно определить, какая система лучше. Для разных задач требуется собственный набор критериев. Для небольших компаний это может быть низкая стоимость запуска и простота обслуживания. Крупные компании могут хранить ценную финансовую информацию, поэтому в приоритете защита данных и функция резервного копирования.