Более мощный компьютер на котором хранится более важная информация

Обновлено: 02.07.2024

Суперкомпьютер – это компьютер, способный производить сотни миллиардов операций за 1 с. Такие большие объёмы вычислений нужны для решения задач в аэродинамике, метеорологии, физике высоких энергий, геофизике. Суперкомпьютеры так же нашли своё применение в финансовой сфере при обработке больших объёмов сделок на биржах. Сверхвысокое быстродействие суперкомпьютера обеспечивается параллельной работой множества микропроцессоров.
Суперкомпьютеры – это не выдумка. Хотя суперкомпьютеры не используются обычными людьми в повседневной жизни, их влияние, как на все человечество, так и на каждого из нас очень заметно. Вернее, стало бы заметно, если бы они в один миг исчезли или сломались.

Суперкомпьютеры – это современные вычислительные машины с высокой мощностью и скоростью обработки данных. Они не выпускаются большими партиями и не продаются в магазинах. Каждый суперкомпьютер уникален, так как разрабатывается и изготавливается под конкретный заказ, для решения определенной задачи. Суперкомпьютеры могут быть как микроскопически малы, так и занимать несколько комнат или даже этажей, все зависит от функций и задач, которые будет решать электронная техника.
Изобретателем суперкомпьютера является американский инженер С.Крей. В 1972 году он открыл свою фирму под названием «Крей Ресерч Инкорпорейтед». Эта фирма занималась разработкой самых высокоскоростных компьютеров в мире. Изобретением стали мультипроцессорные компьютеры, способные осуществлять одновременную обработку данных. В 1976 году был выпущен первый суперкомпьютер под названием «Крей-1», который мог осуществлять 240 млн. вычислений в одну секунду.
Он применялся для научных исследований, таких, например, как моделирование сложных физических явлений. Такие компьютеры приобретались правительственными учреждениями и университетскими лабораториями. Следующие модели Крея – «Крей 1-М» и «Крей X-МР» обладали ещё большим быстродействием.
В 1985 г. появился «Крей-2», который мог выполнить 1 200 млн. операций за 1 с. Представленный в 1988 г. «Крей Y-MP» обладал быстродействием 2 670 млн. операций за 1 с.
Позднее были созданы суперкомпьютеры с ещё большим быстродействием.

Первым отечественным суперкомпьютером является БЭСМ-6, выпущенный в 1967 году под руководством, гениального инженера Сергея Алексеевича Лебедева. Данная машина, по формальной производительности сопоставимая с CDC 6600, реально намного превосходила своего иностранного конкурента. В данном компьютере было заложено так много инновационных решений, что её производство продолжалось на протяжении двадцати лет! Попытка американских инженеров создать что-либо совершеннее БЭСМ-6, носившая имя ILLIAC-IV, окончилась неудачей: данный суперкомпьютер оказалась дороже, сложнее и медленнее "русской машины". БЭСМ-6 не была единственным советским суперкомпьютером. В последние годы своей жизни Лебедев руководил работами по созданию многопроцессорного комплекса "Эльбрус", однако в 1974 году смерть помешала ему увидеть результаты своих трудов. Работы над первым компьютером серии "Эльбрус" завершились в 1979 году, и, хотя по производительности он, равно как и другие компьютеры серии, отставали от зарубежных аналогов, в его процессоре впервые была применена технология суперскалярности. Супер скалярная архитектура, то есть технология параллельного выполнения нескольких команд, независимых друг от друга, вскоре была реализована в большинстве процессоров для персональных компьютеров; таким образом, в процессорах Intel и AMD есть частичка нашего, русского, инженерного знания.

Но, перестройка, раскол Советского Союза и последовавшие за ним события крайне негативно отразились на отечественной суперкомпьютерной промышленности. Прощальным приветом отечественных инженеров-электронщиков можно считать появившийся в 1990-х процессор Elbrus 2000 (E2K) , который так и не смог выйти на рынок: сначала помешал кризис, ну а затем, когда казалось, что "вот уже чуть-чуть", команду "Эльбруса" на корню купила Intel. На данный момент все существующие в России суперкомпьютеры либо зарубежного производства, либо основаны на зарубежных комплектующих и технологиях.
Оправившись от кризиса, индустрия производства суперкомпьютеров принялась за штурм новых высот. В 1997 году был создансуперкомпьютер ASCI RED, обладавший неслыханной тогда производительностью в 1,34 ТФЛОПС. Однако самое интересное, что данный компьютер был построен на базе почти что десяти тысяч процессоров Pentium II , тех самых, которых можно было спокойно найти в любом топовом ПК тех лет. Подобная система объединения вычислительных мощностей относительно недорогих процессоров получила название MassivelyParallelProcessing, или просто MPP. Преимущество MPP-систем - в их гибкости: незагруженные процессорные блоки можно легко отключить, а по возможности - включить заново, а вдобавок подключить дополнительные. На данный момент большинство суперкомпьютеров было построено именно на базе данной технологии.

Шло время, и производители выпускали всё более и более новыесуперкомпьютеры, которые задавали новые стандарты производительности. Символический барьер в один ПФЛОПС (читается "пентафлопс"; 1 ПФЛОПС = 1000 ТФЛОПС) был преодолён в 2008 году компьютером Roadrunner от IBM. Характеристики данной машины, мягко говоря, шокируют: почти 100 Тб оперативной памяти, около 20 000 процессоров. Удивляет и то, что всё это работает под управлением Linux-систем RedHat и Fedora, причём тех же самых версий, что устанавливаются на домашние компьютеры.

Однако Roadrunner не является самым быстрым суперкомпьютером на сегодняшний день. Согласно рейтингу самых мощных компьютеров Top-500, наиболее производительным является японский суперкомпьютер K производства Fujitsu, запущенный в эксплуатацию незадолго до написания этих строк. Этот 70 000-процессорный гигант (причём процессоры, стоит заметить, все до одного восьмиядерные) на момент написания статьи обладал безумной производительностью в 8,162 ПФЛОПС. Даже не хватает воображения, что бы представить, чем же можно нагрузить подобную махину. Впрочем, на это есть учёные - перед ними стоят ещё очень много неразрешённых вопросов.

В соответствии с классификацией, предложенной М.Флинном еще в начале 60-х годов прошлого столетия, параллельные вычислительные системы имеют несколько разновидностей.При этом в основу данной классификации заложено два возможных вида параллелизма: независимость потоков заданий (команд), существующих в системе, и независимость (отсутствие логической связанности) данных, обрабатываемых в каждом потоке:

Традиционной сферой внедрения суперкомпьютеров постоянно были исследования: физика плазмы и статистическая механика, физика конденсированных сред, молекулярная и атомная физика, теория простых частиц, газовая динамика и теория турбулентности, астрофизика.
В химии - разные области вычислительной химии: квантовая химия (включая расчеты электронной структуры для целей конструирования новейших материалов, к примеру, катализаторов и сверхпроводников), молекулярная динамика, хим. кинетика, теория поверхностных явлений и химия твердого тела, конструирование фармацевтических средств. Естественно, что ряд областей внедрения находится на стыках соответственных наук, к примеру, химии и биологии, и перекрывается с техническими приложениями. Так, задачи метеорологии, исследование атмосферных явлений и, сначала, задача длительного прогноза погоды, для решения которой постоянно не хватает мощностей современных суперЭВМ, тесновато соединены с решением ряда вышеперечисленных проблем физики. Посреди технических проблем, для решения которых употребляются суперкомпьютеры, укажем на задачи аэрокосмической и авто индустрии, ядерной энергетики, предсказания и разработки месторождений нужных ископаемых, нефтедобывающей и газовой индустрии (в том числе трудности действенной эксплуатации месторождений, в особенности трехмерные задачки их исследования), и, в конце концов, конструирование новейших микропроцессоров и компов, сначала самих суперЭВМ.

Суперкомпьютеры обычно используются для военных целей. Не считая тривиальных задач разработки орудия массового ликвидирования и конструирования самолетов и ракет, можно упомянуть, к примеру, конструирование бесшумных подводных лодок и др. Самый известный пример - это южноамериканская программа СОИ. Уже упоминавшийся MPP-компьютер Министерства энергетики США будет применяться для моделирования ядерного орудия, что дозволит,в общем, отменить ядерные тесты в данной стране.
Еще есть одна неувязка внедрения суперЭВМ, о которой нужно огласить - это визуализация данных, приобретенных в итоге выполнения расчетов. Нередко, к примеру, при решении дифференциальных уравнений способом сеток, приходится сталкиваться с циклопическими размерами результатов, которые в числовой форме человек просто не в состоянии обработать. Тут во почти всех вариантах нужно обратиться к графической форме представления информации. В любом случае возникает задача транспортировки информации по компьютерной сети. Решению этого комплекса проблем в ближайшее время уделяется все большее внимание. А именно, известный Государственный центр суперкомпьютерных приложений США (NCSA) вместе с компанией SiliconGraphics ведет работы по программе "суперкомпьютерного окружения грядущего". В этом проекте предполагается интегрировать способности суперкомпьютеров POWER CHALLENGE и средств визуализации компании SGI со средствами информационной супермагистрали.

Для кого разрабатываются сверхмощные и сверхумные машины и где они используются? Компьютеры используются учеными при решении задач квантовой физики и механики.

В военной промышленности суперкомпьютеры помогают разрабатывать новые тактические и стратегические позиции, позволяют проводить различные исследования по повышению эффективности готовой боевой техники и по ее модернизации. Также новейшие виды оружия и средств защиты разрабатываются вычислительными машинами.

Исследование ядерных процессов, моделирование цепной реакции и ядерного взрыва дают ученым богатый материал для исследования этих удивительных, но опасных явлений.

Изучение молекулярной структуры белка помогает сделать немало важных и ценных для человечества открытий, определить причины и механизмы генетически обусловленных заболеваний. Такая работа под силу только суперкомпьютерам.

Виртуальные модели кровеносной системы человека исследуются врачами и биологами, чтобы получить эффективные способы борьбы с заболеваниями сердца и сосудов.

Но суперкомпьютеры нужны не только для проведения серьезных научных исследований, результаты которых принесут человечеству плоды только в будущем. Прикладное применение суперкомпьютеров можно обнаружить во многих сферах нашей жизни.

Современные медицинские исследования, новейшие разработки и научные открытия стали возможны именно благодаря суперкомпьютерам, которые позволяют проводить своевременную диагностику, с большим процентом вероятности прогнозировать ход болезни и реакцию организма на лечение. Суперкомпьютеры позволяют моделировать процессы, происходящие в жизненно важных органах, чтобы понять основной принцип их работы и эффективно бороться с патологиями.

В биологии суперкомпьютеры, микрочипы и электронные микроскопы используются для изучения процессов, происходящих на клеточном уровне, что дает большие возможности для серьезнейших научных открытий, способных изменить современную науку.

В медицине и биологии суперкомпьютеры больше нужны именно для исследовательской работы, хотя, некоторые крупные клиники могут позволить себе использовать такие машины и для решения прикладных задач: диагностики и лечения.

Суперкомпьютеры нужны не только для фиксирования данных на борту космических станций и обеспечения эффективности работы этих грандиозных сооружений. Мощнейшая вычислительная техника позволяет проектировать новые орбитальные и межпланетные станции, выстраивать данные оптимальной траектории движения станций, изучать процессы, влияющие на геомагнитный фон Земли, отслеживать и предугадывать всплески солнечной активности и выявить их закономерности.

При разработке новых моделей космических станций и искусственных спутников, суперкомпьютеры проводят серьезную работу по моделированию и прогнозированию всех возможных ситуаций, обеспечивая, таким образом, безопасность полета.
Климат и погода.
Благодаря суперкомпьютерам стало возможно очень точно предсказывать погоду. Цифровая обработка данных, полученных на метеорологических станциях, производится в кратчайшие сроки, что дает шанс заглянуть в будущее и предупредить людей о возможных погодных неприятностях. Эта работа суперкомпьютеров тесно связана с прогнозами стихийных бедствий, которые способны спасти жизнь многих людей.
Стихийные бедствия и экологические катастрофы.
Современные мощные суперкомпьютеры дают возможность с большой долей вероятности прогнозировать природные катаклизмы: землетрясения, цунами, пожары, наводнения и штормы. Чем раньше люди получат информацию о надвигающейся беде, чем больше у них шансов спастись.
Промышленность.
Благодаря суперкомпьютерам наша жизнь становится более комфортабельной и безопасной, ведь именно эти машины помогают разрабатывать новые модели автомобилей и самолетов. Исследование аэродинамических свойств, устойчивости, маневренности, способы сочетать эти качества в оптимальной пропорции могут только суперкомпьютеры.

Сеть - группа компьютеров, соединенных друг с другом, с помощью оборудования, кабелей, wi fi или иным способом обеспечивающего пакетный обмен информацией между ними. Вся информация в сети передается пакетным образом с ипользованием протоколов IP и TCP. Сегодня обмен между компьютерами осуществляется именно таким образом и другие способы мы не будем рассматривать подробно по причине их редкого использования. Соединение между двумя компьютерами может быть непосредственным или с использованием локальной сети управляемой роутером

Новые вопросы в Информатика

Кіт Леопольд пішов на рибалку та наловив риби. Кожну рибу він старанно зважив. Перша риба (найменша), яку він зважував важила рівно L грам. Кожна на … ступна рибина була на K грамів важча за попередню. Скільки заважила вся риба, яку наловив Леопольд, якщо відомо, що спіймав він N (N>0) риб? Вхідні дані Програма зчитує з клавіатури 3 цілих числа N, L і K, введені через пропуск (N- кількість рибин, L - маса першої риби у грамах, K - на скільки кожна наступна рибина важча від попередньої). Вихідні дані Програма виводить на екран одне ціле число - масу всієї упійманої риби у грамах.

посчитайте, используя ЭТ, хватит ливам 1000 тенге, чтоб купить все продукты, которые вам заказала мама, и хватит ли купить чипсы за 150 теньге?

Запишіть арифметичні вирази (див. прикріплений малюнок) мовою Python та виведіть їх результат.x=5 a=2 b=4c=3

Книга занимает 64 страницы, на каждой странице 16 строк, в каждой строке - по 50 символов. Сколько символов в книге?

Размер картинки 100 на 200, всего цветов 1024 в палитре. Вычислить объем картинки в Килобайтах.

11. Що таке вкладені розгалуження? а) це фрагмент алгоритму, у якому одне розгалуження міститься всередені іншого розгалуження б) це розгалуження, яке … має декілька умов в) це фрагмент алгоритму, у якому одне розгалуження виконується після виконання поперенього розгалуження

Які з наведених процесів є циклічними? А зміна пори року Б написання твору В вивчення вірша Г малювання орнаменту. срочно пж

построй таблицу истинности A v (B^C знак приставки) решите пж срочно.

Множество А содержит 8 элементов, множество B содержит 7 элементов, множество C содержит 6 элементов. Алексей сначала выбирает все элементы, которые п … ринадлежат хотя бы одному из множеств А или В, а потом из получившегося множества удаляет элементы, которые принадлежат C. Какое наименьшее количество элементов может остаться, если рассмотреть все возможные способы взаимного расположения исходных множеств?

Компьютер является именно электронно вычислительной машиной и собирается из нескольких разных устройств, которые называются аппаратным обеспечением. Собранные вместе в системном блоке они и составляют ПК. Также, это правило и распространяется и на другие устройства.

Позволяет решать, выполнять, обрабатывать самые различные задачи и является многозадачным и универсальным вычислительным средством. С помощью него можно: хранить и обрабатывать информацию, играть в игры, заниматься программированием, работать с векторной и растровой графикой и т.д.

Энергопитание

Это также важный фактор, на который далеко не все пользователи обращают внимание. Если у вас мощный компьютер с хорошей системой охлаждения, вам нет необходимости заниматься экономией энергопитания. Если же нет, то следует в настройках панели управления выставить экономный или подобный режим, который имеется в вашем компьютере.

Охлаждение компьютера тоже играет большую роль. В игровых компьютерах используется специальная система охлаждения. В остальных такой системы нет. Если вы часто проводите время за компьютером, то стоит подобную систему поставить или при покупке нового компьютера заказать такую систему.

Когда в помещении жарко, системный блок нагревается, и остальные комплектующие тоже. Это не лучшим образом сказывается на производительности компьютера.

И здесь нет такой необходимости знать, что такое ПК в компьютере.

Компьютерные проблемы

Как и у каждой вещи, которой и является компьютер, существуют технические проблемы, которые необходимо решать по мере их наступления. Если перегорела видеокарта, следует ее заменить, купив новую. Не нужно разбирать ее, стараясь починить. Прогресс не стоит на месте. Потратив немного денег, вы сможете приобрести более «продвинутую» вещь, нежели была у вас раньше. Но при одном условии, если ее замена действительно необходима.

В таких случаях важно контролировать работоспособность компьютера, чтобы не допустить случаев замены комплектующих вашего помощника. А для этого следует производить профилактику и делать это постоянно. Как только научитесь, то ответите на вопрос: что такое ПК-пользователь? А как это осуществить, будет рассказано ниже.

Виды компьютеров классификация

Их можно разделить на две основные группы:

По архитектуре:

Аналоговые
Цифровые
Гибридные
Гарвардская архитектура
Архитектура фон Неймана
Сокращенный набор команд

По размеру и форм фактору:

Анализируем классификацию

Итак, рассмотрим подробнее классификацию вычислительных машин (компьютеров), чтобы разобраться, чем же отличаются ПК от ЭВМ.

Устройства для вычислений бывают:

Аналоговые
Дискретные (цифровые)
Гибридные

Аналоговые и гибридные машины не получили дальнейшего развития.

В то же время дискретные машины подразделяются на механические и электронные (ЭЦВМ, ЭВМ).

В свою очередь ЭЦВМ бывают программируемыми и непрограммируемыми. Непрограммируемые ЭВМ – это известные нам со школьной скамьи калькуляторы. Программируемые могут быть, в частности, универсальными (это и есть ЭВМ, компьютеры). Также существуют контроллеры (машины специализированного назначения).

Теперь перейдем к самой любопытной и прогрессивной ветви.

ЭВМ бывают:

персональными (ПЭВМ);
серверами;
мини-ЭВМ;
Mainframes;
супер-ЭВМ.

Как видим, универсальные электронно-вычислительные машины могут иметь различное применение, в частности, они могут быть персональными.

Таким образом, исследовав эту нехитрую цепочку, приходим к выводу, что ПК – это один из подвидов ЭВМ.

Стоит добавить, что ПК могут быть стационарными (моноблок или системный блок + монитор) и носимыми. О носимых ПК всем хорошо известно. Это ноутбуки, таблеты и смартфоны.

Состав ПК

Если рассматривать типичный настольный компьютер, то он состоит из трех основных частей:

системный блок
монитор
устройства для ввода данных (мышь, клавиатура)

Это минимальный состав ПК, которым по умолчанию укомплектованы все современные компьютерные устройства.

Базовые компоненты системного блока:

Материнская или системная плата («мать») — основа компьютера. Содержит разъёмы (слоты), к которым подключается всё остальное оборудование.
Центральный процессор (CPU), по сути, это мозг компьютера. Он заставляет работать всю операционную систему устройства и установленные приложения.
Оперативная память или оперативное запоминающее устройство (ОЗУ). Его задача — временное хранение данных и команд.
Жесткий диск. На нем хранится вся информация, которую вы сохранили. В ПК возможна установка нескольких жестких дисков. Варианты названий: винт, хард, харддиск, HDD.
Кулер для охлаждения процессора.
Блок питания.

По мере необходимости составные части компьютера можно наращивать и заменять. Тут уже ограничений практически не существует. Вы можете установить видеокарту любой мощности (если используемый блок питания ее потянет), расширить память компьютера до нужного размера, добавить один или несколько жестких дисков.

В общем, любой апгрейд за ваши деньги. Проще всего это сделать на стационарном компьютере. Ведь чем компактнее устройство, тем тяжелее изменить его технические характеристики. Например, в ноутбуке обычно можно лишь добавить оперативной памяти и поменять жесткий диск.

Отдельная тема — это игровой компьютер. Обычно они стоят очень дорого (за сотню тысяч рублей), но если подходить с умом к выбору комплектующих к игровому ПК, то можно будет существенно сэкономить не потеряв особо в производительности.

Совет. Не покупайте топовые процессор и видеокарту — возьмите те, что идут в следующей за топовой линейке. Таким образом вы получите практически идентичную производительность, но сэкономите десятки тысяч рублей.

TL;DR: Вводная статья с описанием разных вариантов хранения данных. Будут рассмотрены принципы, описаны преимущества и недостатки, а также предпочтительные варианты использования.

Зачем это все?

Хранение данных — одно из важнейших направлений развития компьютеров, возникшее после появления энергонезависимых запоминающих устройств. Системы хранения данных разных масштабов применяются повсеместно: в банках, магазинах, предприятиях. По мере роста требований к хранимым данным растет сложность хранилищ данных.

Надежно хранить данные в больших объемах, а также выдерживать отказы физических носителей — весьма интересная и сложная инженерная задача.

Хранение данных

Под хранением обычно понимают запись данных на некоторые накопители данных, с целью их (данных) дальнейшего использования. Опустим исторические варианты организации хранения, рассмотрим подробнее классификацию систем хранения по разным критериям. Я выбрал следующие критерии для классификации: по способу подключения, по типу используемых носителей, по форме хранения данных, по реализации.

По способу подключения есть следующие варианты:

Внутреннее. Сюда относятся классическое подключение дисков в компьютерах, накопители данных устанавливаются непосредственно в том же корпусе, где и будут использоваться. Типовые шины для подключения — SATA, SAS, из устаревших — IDE, SCSI.

подключение дисков в сервере

Внешнее. Подразумевается подключение накопителей с использованием некоторой внешней шины, например FC, SAS, IB, либо с использованием высокоскоростных сетевых карт.

дисковая полка, подключаемая по FC

По типу используемых накопителей возможно выделить:

Дисковые. Предельно простой и вероятно наиболее распространенный вариант до сих пор, в качестве накопителей используются жесткие диски
Ленточные. В качестве накопителей используются запоминающие устройства с носителем на магнитной ленте. Наиболее частое применение — организация резервного копирования.
Flash. В качестве накопителей применяются твердотельные диски, они же SSD. Наиболее перспективный и быстрый способ организации хранилищ, по емкости SSD уже фактически сравнялись с жесткими дисками (местами и более емкие). Однако по стоимости хранения они все еще дороже.
Гибридные. Совмещающие в одной системе как жесткие диски, так и SSD. Являются промежуточным вариантом, совмещающим достоинства и недостатки дисковых и flash хранилищ.

Если рассматривать форму хранения данных, то явно выделяются следующие:

Файлы (именованные области данных). Наиболее популярный тип хранения данных — структура подразумевает хранение данных, одинаковое для пользователя и для накопителя.
Блоки. Одинаковые по размеру области, при этом структура данных задается пользователем. Характерной особенностью является оптимизация скорости доступа за счет отсутствия слоя преобразования блоки-файлы, присутствующего в предыдущем способе.
Объекты. Данные хранятся в плоской файловой структуре в виде объектов с метаданными.

По реализации достаточно сложно провести четкие границы, однако можно отметить:

аппаратные, например RAID и HBA контроллеры, специализированные СХД.

RAID контроллер от компании Fujitsu

Программные. Например реализации RAID, включая файловые системы (например, BtrFS), специализированные сетевые файловые системы (NFS) и протоколы (iSCSI), а также SDS

пример организации LVM с шифрованием и избыточностью в виртуальной машине Linux в облаке Azure

Давайте рассмотрим более детально некоторые технологии, их достоинства и недостатки.

Direct Attached Storage — это исторически первый вариант подключения носителей, применяемый до сих пор. Накопитель, с точки зрения компьютера, в котором он установлен, используется монопольно, обращение с накопителем происходит поблочно, обеспечивая максимальную скорость обмена данными с накопителем с минимальными задержками. Также это наиболее дешевый вариант организации системы хранения данных, однако не лишенный своих недостатков. К примеру если нужно организовать хранение данных предприятия на нескольких серверах, то такой способ организации не позволяет совместное использование дисков разных серверов между собой, так что система хранения данных будет не оптимальной: некоторые сервера будут испытывать недостаток дискового пространства, другие же — не будут полностью его утилизировать:

Конфигурации систем с единственным накопителем применяются чаще всего для нетребовательных нагрузок, обычно для домашнего применения. Для профессиональных целей, а также промышленного применения чаще всего используется несколько накопителей, объединенных в RAID-массив программно, либо с помощью аппаратной карты RAID для достижения отказоустойчивости и\или более высокой скорости работы, чем единичный накопитель. Также есть возможность организации кэширования наиболее часто используемых данных на более быстром, но менее емком твердотельном накопителе для достижения и большой емкости и большой скорости работы дисковой подсистемы компьютера.

Storage area network, она же сеть хранения данных, является технологией организации системы хранения данных с использованием выделенной сети, позволяя таким образом подключать диски к серверам с использованием специализированного оборудования. Так решается вопрос с утилизацией дискового пространства серверами, а также устраняются точки отказа, неизбежно присутствующие в системах хранения данных на основе DAS. Сеть хранения данных чаще всего использует технологию Fibre Channel, однако явной привязки к технологии передачи данных — нет. Накопители используются в блочном режиме, для общения с накопителями используются протоколы SCSI и NVMe, инкапсулируемые в кадры FC, либо в стандартные пакеты TCP, например в случае использования SAN на основе iSCSI.

Давайте разберем более детально устройство SAN, для этого логически разделим ее на две важных части, сервера с HBA и дисковые полки, как оконечные устройства, а также коммутаторы (в больших системах — маршрутизаторы) и кабели, как средства построения сети. HBA — специализированный контроллер, размещаемый в сервере, подключаемом к SAN. Через этот контроллер сервер будет «видеть» диски, размещаемые в дисковых полках. Сервера и дисковые полки не обязательно должны размещаться рядом, хотя для достижения высокой производительности и малых задержек это рекомендуется. Сервера и полки подключаются к коммутатору, который организует общую среду передачи данных. Коммутаторы могут также соединяться с собой с помощью межкоммутаторных соединений, совокупность всех коммутаторов и их соединений называется фабрикой. Есть разные варианты реализации фабрики, я не буду тут останавливаться подробно. Для отказоустойчивости рекомендуется подключать минимум две фабрики к каждому HBA в сервере (иногда ставят несколько HBA) и к каждой дисковой полке, чтобы коммутаторы не стали точкой отказа SAN.

Недостатками такой системы являются большая стоимость и сложность, поскольку для обеспечения отказоустойчивости требуется обеспечить несколько путей доступа (multipath) серверов к дисковым полкам, а значит, как минимум, задублировать фабрики. Также в силу физических ограничений (скорость света в общем и емкость передачи данных в информационной матрице коммутаторов в частности) хоть и существует возможность неограниченного подключения устройств между собой, на практике чаще всего есть ограничения по числу соединений (в том числе и между коммутаторами), числу дисковых полок и тому подобное.

Network attached storage, или сетевое файловое хранилище, представляет дисковые ресурсы в виде файлов (или объектов) с использованием сетевых протоколов, например NFS, SMB и прочих. Принципиально базируется на DAS, но ключевым отличием является предоставление общего файлового доступа. Так как работа ведется по сети — сама система хранения может быть сколько угодно далеко от потребителей (в разумных пределах разумеется), но это же является и недостатком в случае организации на предприятиях или в датацентрах, поскольку для работы утилизируется полоса пропускания основной сети — что, однако, может быть нивелировано с использованием выделенных сетевых карт для доступа к NAS. Также по сравнению с SAN упрощается работа клиентов, поскольку сервер NAS берет на себя все вопросы по общему доступу и т.п.

Unified storage

Универсальные системы, позволяющие совмещать в себе как функции NAS так и SAN. Чаще всего по реализации это SAN, в которой есть возможность активировать файловый доступ к дисковому пространству. Для этого устанавливаются дополнительные сетевые карты (или используются уже существующие, если SAN построена на их основе), после чего создается файловая система на некотором блочном устройстве — и уже она раздается по сети клиентам через некоторый файловый протокол, например NFS.

Software-defined storage — программно определяемое хранилище данных, основанное на DAS, при котором дисковые подсистемы нескольких серверов логически объединяются между собой в кластер, который дает своим клиентам доступ к общему дисковому пространству.

Наиболее яркими представителями являются GlusterFS и Ceph, но также подобные вещи можно сделать и традиционными средствами (например на основе LVM2, программной реализации iSCSI и NFS).

N.B. редактора: У вас есть возможность изучить технологию сетевого хранилища Ceph, чтобы использовать в своих проектах для повышения отказоустойчивости, на нашем практическим курсе по Ceph. В начале курса вы получите системные знания по базовым понятиям и терминам, а по окончании научитесь полноценно устанавливать, настраивать и управлять Ceph. Детали и полная программа курса здесь.

Пример SDS на основе GlusterFS

Из преимуществ SDS — можно построить отказоустойчивую производительную реплицируемую систему хранения данных с использованием обычного, возможно даже устаревшего оборудования. Если убрать зависимость от основной сети, то есть добавить выделенные сетевые карты для работы SDS, то получается решение с преимуществами больших SAN\NAS, но без присущих им недостатков. Я считаю, что за подобными системами — будущее, особенно с учетом того, что быстрая сетевая инфраструктура более универсальная (ее можно использовать и для других целей), а также дешевеет гораздо быстрее, чем специализированное оборудование для построения SAN. Недостатком можно назвать увеличение сложности по сравнению с обычным NAS, а также излишней перегруженностью (нужно больше оборудования) в условиях малых систем хранения данных.

Гиперконвергентные системы

Подавляющее большинство систем хранения данных используется для организации дисков виртуальных машин, при использовании SAN неизбежно происходит удорожание инфраструктуры. Но если объединить дисковые системы серверов с помощью SDS, а процессорные ресурсы и оперативную память с помощью гипервизоров отдавать виртуальным машинам, использующим дисковые ресурсы этой SDS — получится неплохо сэкономить. Такой подход с тесной интеграцией хранилища совместно с другими ресурсами называется гиперконвергентностью. Ключевой особенностью тут является способность почти бесконечного роста при нехватке ресурсов, поскольку если не хватает ресурсов, достаточно добавить еще один сервер с дисками к общей системе, чтобы нарастить ее. На практике обычно есть ограничения, но в целом наращивать получается гораздо проще, чем чистую SAN. Недостатком является обычно достаточно высокая стоимость подобных решений, но в целом совокупная стоимость владения обычно снижается.

Облака и эфемерные хранилища

Логическим продолжением перехода на виртуализацию является запуск сервисов в облаках. В предельном случае сервисы разбиваются на функции, запускаемые по требованию (бессерверные вычисления, serverless). Важной особенностью тут является отсутствие состояния, то есть сервисы запускаются по требованию и потенциально могут быть запущены столько экземпляров приложения, сколько требуется для текущей нагрузки. Большинство поставщиков (GCP, Azure, Amazon и прочие) облачных решений предлагают также и доступ к хранилищам, включая файловые и блочные, а также объектные. Некоторые предлагают дополнительно облачные базы, так что приложение, рассчитанное на запуск в таком облаке, легко может работать с подобными системами хранения данных. Для того, чтобы все работало, достаточно оплатить вовремя эти услуги, для небольших приложений поставщики вообще предлагают бесплатное использование ресурсов в течение некоторого срока, либо вообще навсегда.

Из недостатков: могут заблокировать аккаунт, на котором все работает, что может привести к простоям в работе. Также могут быть проблемы со связностью и\или доступностью таких сервисов по сети, поскольку такие хранилища полностью зависят от корректной и правильной работы глобальной сети.

Заключение

Надеюсь, статья была полезной не только новичкам. Предлагаю обсудить в комментариях дополнительные возможности систем хранения данных, написать о своем опыте построения систем хранения данных.

Читайте также: