Современные системы хранения данных | IT статьи

Современные системы хранения данных

Февраль 19, 2010

Что такое системы хранения данных (СХД) и для чего они нужны? В чём разница между iSCSI и FibreChannel? благодаря этому данное словосочетание только в крайние годы стало несомненно широкому кругу IT-специалистов и почему вопросы систем хранения данных всё больше и больше тревожат вдумчивые умы
Думаю, значительные заметили линии обновления в охватывающем нас компьютерном мире – перевод от экстенсивной модели обновления к интенсивной. Наращивание мегагерц процессоров уже не даёт видимого продукта (см. Обзор «Извечный риторический вопрос: Intel или AMD») а обновление накопителей не поспевает за объёмом информации

Если. В случае процессоров всё относительно несомненно – достаточно собирать многопроцессорные системы и/или использовать несколько ядер в одном процессоре, то в случае вопросов хранения и обработки информации так обычно от проблем не избавиться

Существующая. На данный аспект панацея от справочной эпидемии – СХД. Название расшифровывается как Сеть Хранения Данных (SAN) или Система Хранения Данных. В любом случае – это специализированное железо и ПО, предопределенное для службы с крупными массивами ценной информации
Сразу. Оговоримся, что нас в магистральную очередь интересует информация, эксплуатируемая в бизнесе, от которой зависит деятельность предприятия и его обычное функционирование. Ведь «домашнего пользователя» темы хранения и обработки данных касаются в меньшей степени
Основные. Проблемы, решаемые СХД

Итак, какие же задачи призвана решить СХД? Рассмотрим типичные темы, связанные с растущими объёмами информации в любой организации. Предположим, что это хотя несколько десятков серверов и несколько разнесённых территориально офисов

1. Децентрализация информации – если выше все данные могли храниться просто на одном жёстком диске, то сейчас любая функциональная система требует самостоятельного хранилища – к примеру, компьютеров электронной почты, СУБД, домена и так далее. Ситуация усложняется в случае распределённых офисов (филиалов

2) Лавинообразный рост информации – зачастую количество жёстких дисков, которые вы можете установить в конкретный компьютер, не может покрыть нужную системе ёмкость

Как. Следствие

Невозможность: полноценно защитить хранимые данные – в действительности, ведь довольно трудно произвести даже backup данных, которые находятся не только на разных компьютерах, но и разнесены территориально

Недостаточная. Скорость обработки информации – каналы последовательности между удалёнными площадками пока оставляют желать лучшего, но даже при достаточно «толстом» канале не всегда виртуально полноценное применение существующих сетей, так например, IP, для работы

Сложность. Резервного копирования (архивирования) – если данные читаются и записываются низкими источниками, то произвести неограниченное сжатие информации с удалённого компьютера по существующим каналам возможно нереально – необходима передача только объёма данных. Архивирование на местах зачастую нецелесообразно по материальным соображениям – необходимы системы для резервного копирования (ленточные накопители, так например) специализированное ПО (которое может стоить крупных денег) обученный и квалифицированный персонал

3. Сложно или нереально предугадать предписываемый объём дискового пространства при развертывании компьютерной системы

Как. Следствие

Возникают: темы расширения дисковых ёмкостей – довольно сложно получить в компьютере ёмкости порядков терабайт, в особенности если система уже работает на существующих дисках мгновенный ёмкости – как как минимум, требуется остановка системы и неэффективные финансовые вложения

Неэффективная. Утилизация ресурсов – порой не угадать, в каком компьютере данные будут расти скорее. В компьютере электронной почты возможно свободен критически миниатюрный объём дискового пространства, в то время как другое подразделение будет использовать токмо 20% объёма недешёвой дисковой системы (например, SCSI

4) Низкая степень конфиденциальности распределённых данных – нереально проконтролировать и ограничить подступ в соответствии с политикой безопасности предприятия. Это касается как подступа к данным по существующим для этого каналам (локальная сеть) так и материального подступа к носителям – к примеру, не исключены хищения жёстких дисков, их уничтожение (с целью затруднить бизнес организации) Неквалифицированные действия пользователей и сервисного персонала могут нанести ещё максимальный вред. Когда компания в любом офисе вынуждена решать мелкие локальные темы безопасности, это не даёт требуемого результата

5. Сложность управления распределёнными потоками информации – любые действия, которые направлены на изменения данных в любом отделе, содержащем очередь распределённых данных, создает определённые темы, начиная от сложности синхронизации различных баз данных, версий файлов разработчиков и заканчивая ненужным дублированием информации

6Низкий. Экономический эффект внедрения «классических» определений – по мере роста справочной сети, крупных объёмов данных и всё более распределённой структуры предприятия финансовые приложения оказываются не столь эффективны и зачастую не могут решить создаваемых проблем

7. Высокие расходы эксплуатируемых ресурсов для поддержания работоспособности всей справочной системы предприятия – начиная от необходимости содержать мощный штат квалифицированного персонала и заканчивая крупными недешёвыми аппаратными решениями, которые призваны решить тему объёмов и скоростей подступа к информации вкупе с надёжностью хранения и защитой от сбоев

В. Свете вышеперечисленных проблем, которые обязательно полностью или частично настигают любую динамично развивающуюся компанию, попробуем обрисовать системы хранения данных – такими, какими они должны быть. Рассмотрим типовые схемы включения и виды систем хранения данных
Мегабайты. Или транзакции

Если? Выше жёсткие диски находились внутри сервера (сервера) то теперь им там стало тесно и не очень надёжно. Самое обычное определение (разработанное достаточно давно и применяемое где угодно) – технология RAID
При. Организации RAID в любых системах хранения данных дополнительно к охране информации мы получаем несколько неоспоримых преимуществ, одно из которых – скорость подступа к информации

С. Точки зрения пользователя или ПО, скорость определяется не только пропускной способностью системы (Мбайт/с) но и количеством транзакций – то есть количеством операций ввода-вывода в цифру времени (IOPS) Увеличению IOPS способствует, что вполне закономерно, большее количество дисков и те методики повышения производительности, которые предоставляет контроллер RAID (к примеру, кэширование

Если) для досмотра потокового видео или организации файл-сервера больше важна общая пропускная способность, то для СУБД, любых OLTP (online transaction processing) добавлений критично просто количество транзакций, которые способна обрабатывать система. А с этим параметром у насущных жёстких дисков всё не так радужно, как с растущими объёмами и, частично, скоростями. Все эти темы призвана решить сама система хранения данных – чуть далее будет если угодно, как и какими методами
Уровни. Защиты

Нужно понимать, что в основе всех систем хранения данных лежит практика охраны информации на базе технологии RAID – без этого любая технически продвинутая СХД будет бесполезна, потому жёсткие диски в этой системе являются самым ненадёжным компонентом. Организация дисков в RAID – это «нижнее звено», форпост охраны информации и повышения скорости обработки

Однако. Кроме схем RAID, существует и более низкоуровневая эгида данных, реализованная «поверх» технологий и определений, внедрённых в сам жёсткий диск его создателем. К примеру, у одного из решающих создателей СХД – компании ЕМС – существует методика вспомогательного анализа целостности данных на уровне секторов накопителя. Секторы на жёстких дисках, введенных в системы хранения данных ЕМС, имеют размер не 512 байт (стандарт) а 520 байт – лишние 8 байт на любой сектор играют роль нестандартной базы данных, все равно куда СХД записывает информацию о «здоровье» любого сектора (данная методика, насколько известное дело, не применяется больше ни у одного производителя

Как) известное дело, у жёстких дисков с интерфейсом IDE существует технология SMART, призванная предсказывать возможные темы в службе диска, которая зачастую работает очень неточно, что сводит её ценность практически к нулю. У дисков же, использующихся в серьёзных СХД (диски SCSI и FibreChannel) изначально не было технологии SMART – поэтому оценка целостности и верификация данных любого конкретного сектора – мощный плюс, позволяющий дополнительно защитить данные и уведомить менеджера системы о потенциальных проблемах задолго до аспекта их материального наступления

Жёсткий. Диск возможно и исправен, но обладать так указываемыми проблемами «мягких ошибок» («soft errors») – когда данные в секторе записаны предупредительно, но считывание их может давать различный продукт. Такой вариант неприемлем, но «remap» (подмена) такого сектора средствами самого жёсткого диска не происходит – в этом случае и спасает технология анализа любого сектора, применяемая у EMC.

Комментировать

Включена модерация комментариев. Пройдет некоторое время прежде, чем Ваш комментарий появится.