Сколько памяти занимает википедия

Обновлено: 07.07.2024

Вопросом о том, сколько весит интернет, интересовал многих исследователей. Группы ученых использовали разные подходы для того, чтобы подсчитать количество письменной, аудиальной и визуальной информации. В это и упиралась главная сложность: нужно было найти общее «мерило» для всех видов контента, а также помножить это на ежедневную тенденцию к расширению глобальной сети. Мы собрали главное о том, сколько месте занимает интернет и куда нас приведет его бурный рост.

Читайте «Хайтек» в

Были ли исследования на эту тему?

Рассчитать массу интернета можно несколькими путями, по крайне мере ученые расходятся в способах.

Первый метод расчета массы Сети, предложенный Расселом Сейтцем, использует данные о количестве серверов, поддерживающих ее работу (от 75 до 100 млн по разным данным), об их среднем энергопотреблении (от 350 до 550 Вт), среднем напряжении в их логических схемах (3 В) и тактовой частоты (1 ГГц).

Силу тока в 1 Ампер создает поток из примерно 1 018 электронов в секунду. Прямой расчет показывает, что работа интернета в целом обеспечивается движением чуть более 50 грамм электронов.

Рассел Сейтц, ведущий исследователь

Другой точки зрения придерживались сотрудники американского научно-популярного журнала Discovery.

Вот как рассуждали они: длиннейшая цепочка единиц и нулей, в которой зашифрован передаваемый документ, для путешествия по сети разбивается на пакеты размером от нескольких десятков до нескольких сотен байт. К каждому пакету цепляется еще и адрес, куда его слать, и номер, позволяющий на месте получения правильно собрать пакеты в единое целое. По дороге эти пакеты проходят через множество компьютеров, и в каждом они ненадолго задерживаются в памяти и анализируются. Затем определяется их дальнейший путь, и они пересылаются дальше.

Оба расчета исходят из массы покоя электронов (9,1*10−31 кг). По словам того же Рассела Сейтца, для «подпитывания» потока 50 грамм электронов приходится прилагать около 50 млн лошадиных сил.

Как рассчитывать массу?

Если эту небольшую статью послать по электронной почте, она займет около 25 КБ (только текст, без картинки). В килобайте 1 024 байт, в байте — 8 бит. Следовательно, объем статьи в битах — 205 000. Можно считать, что из них половина единицы, половина — нули. Значит, единиц 102 500, и каждая изображается 40 тысячами электронов. В целом на запись этой статьи пошло примерно 4 млрд электронов. Масса электрона 9,11.10 28 грамма, умножьте — и вы получите массу данного текста в памяти компьютера.

Но это только одно электронное письмо. По данным за 2008 год, вся пересылаемая информация за день весила 0,0057 миллиграмма. И еще треть от этого веса надо добавить, если мы хотим учесть не только обмен файлами между пользователями, но и информацию, запрашиваемую у сайтов.

Как активность изменилась сегодня?

Согласно сервису Internet Live Stats , каждую секунду в Google делается более 50 000 поисковых запросов, просматривается 120 000 видео на YouTube, отправляется почти 2,5 млн электронных писем. Да, весьма впечатляет, но всё же эти данные не позволяют в полной мере представить себе размеры интернета.

В сентябре 2014 года общее количество сайтов перевалило за миллиард , и сегодня их примерно 1,018 млрд . А ведь здесь еще не подсчитана так называемая «глубокая паутина», то есть совокупность сайтов, не индексируемых поисковиками: контент там может быть как совершенно безобидным (например, онлайновые базы данных), так и совершенно незаконным (к примеру, торговые площадки черного рынка с доступом только через Tor). Хотя браузером Tor пользуются не только нарушители, но и пользователи, которые хотят анонимности.

Отметим, что вышеприведенная оценка численности веб-сайтов является приблизительной. Сайты возникают и исчезают, к тому же размеры глубокой и темной паутин определить практически невозможно. Поэтому даже приблизительно оценивать размеры сети по этому критерию весьма непросто. Но одно несомненно — сеть постоянно растет.

Одним из способов оценки циркулирующей в интернете информации является измерение трафика. Согласно данным Cisco , к концу 2016 года по всему миру будет передано 1,1 зеттабайта данных. А в 2019 году объем трафика удвоился достигнув 2 зеттабайт в год.

Но как можно попытаться представить себе 10 21 байт? Один зеттабайт эквивалентен 36 000 лет HDTV-видео. И понадобится 5 лет для просмотра видео, передаваемого по миру каждую секунду.

Как эта информация представлена на физических носителях?

Несмотря на восход цифрового века, для многих из нас биты и байты остаются понятиями несколько абстрактными. Раньше память измеряли мегабайтами, теперь гигабайтами. А что, если попробовать представить размер интернета в каком-то вещественном воплощении?

В 2015 году двое ученых предложили использовать для оценки настоящие бумажные страницы А4. Взяв за основу данные с вышеупомянутого сервиса WorldWideWebSize, они решили считать каждую веб-страницу эквивалентной 30 страницам бумажным. Получили 4,54 х 10 9 х 30 = 1,36 х 10 11 страниц А4.

Но с точки зрения человеческого восприятия это ничем не лучше тех же байтов. Поэтому бумагу привязали к амазонским джунглям. Согласно расчету авторов, для изготовления вышеуказанного количества бумаги нужно 8 011 765 деревьев, что эквивалентно 113 км 2 джунглей, то есть 0,002% от общей площади амазонских зарослей.

Хотя позднее в газете Washington Post предположили , что 30 страниц — слишком много, и одну веб-страницу правильнее приравнять к 6,5 страницам А4. Тогда весь интернет можно распечатать на 305,5 млрд бумажных листов.

Но всё это справедливо лишь для текстовой информации, которая занимает далеко не самую большую долю от общего объема данных. Согласно Cisco , в 2015 году на одно только видео приходилось 27 500 ПБ в месяц, а совокупный трафик веб-сайтов, электронной почты и «данных» — 7 700 ПБ.

Немногим меньше пришлось на передачу файлов — 6 100 ПБ. Если кто забыл, петабайт равен миллиону гигабайт. Так что амазонские джунгли никак не позволят представить объемы данных в интернете.

В упомянутом выше исследовании от 2011 года предлагалось визуализировать с помощью компакт-дисков. Как утверждают авторы, в 2007 году 94% все информации было представлено в цифровом виде — 277,3 оптимально сжатых эксабайта (термин, обозначающий сжатие данных с помощью наиболее эффективных алгоритмов, доступных в 2007 году).

Если записать всё это богатство на DVD (по 4,7 Гб), то получим 59 000 000 000 болванок. Если считать толщину одного диска равной 1,2 мм, то эта стопка будет высотой 70 800 км.

Для сравнения, длина экватора равна 40 000 км, а общая протяженность государственной границы России — 61 000 км. Причем это объем данных по состоянию на 2007 год. Теперь попробуем таким же образом оценить общий объём трафика, который прогнозируется на этот год — 1,1 зеттабайта. Получим стопку DVD-дисков высотой 280 850 км. Тут уже впору переходить на космические сравнения: среднее расстояние до Луны составляет 385 000 км.

Как изменится объем информации: прогнозы ученых

Сотрудник Портсмутского университета Мелвин Вопсон подсчитал, что цифровая информация может составить половину массы Земли уже к 2245 году при нынешних темпах ее увеличения. Свою статью ученый опубликовал в журнале AIP Advances.

Вопсон основывается на принципе эквивалентности массы и энергии в общей теории относительности Эйнштейна, а также на работе Рольфа Ландауэра, который применил законы термодинамики к информации, и на исследовании Клода Шеннона, который изобрел бит.

Согласно Вопсону, примерно через 130 лет энергия, необходимая для поддержания процесса создания цифровой информации, сравняется со всей энергией, производимой в настоящее время на планете Земля, и к 2245 году половина массы Земли будет преобразована в «массу цифровой информации».

Ученый сделал такой вывод, поскольку человечество использует такие ресурсы, как уголь, нефть, природный газ, медь, кремний и алюминий для создания и поддержания работы огромных компьютерных ферм и обработки цифровой информации, это ведет к перераспределению земной материи от физических атомов к цифровой информации — пятому состоянию материи наряду с жидкостью, твердым телом, газом и плазмой.

В конце концов, согласно автору новой работы, мы достигнем состояния, когда количество битов, созданных человеком, превзойдет количество атомов на Земле. Согласно расчетам Вопсона, это произойдет уже через 150 лет, учитывая нынешние темпы прироста количества информации по 50% в год.

Рост количества цифровой информации кажется неудержимым. По данным IBM и других компаний, занимающихся исследованием больших данных, 90% мировой информации, существующей сегодня, было создано только за последние 10 лет. В некотором смысле нынешняя пандемия COVID-19 ускорила этот процесс, поскольку благодаря ей мы начали производить и использовать больше цифрового контента, чем когда-либо прежде.

Мелвин Вопсон, сотрудник Портсмутского университета

Физик заявил, что через 130 лет энергия, необходимая для поддержания процесса создания цифровой информации, сравняется со всей энергией, которая производится сейчас на Земле. Ученый также отметил, что 90% мировой информации, существующей сегодня, было создано за последние десять лет.

Каков объем Википедии в гигабайтах? Казалось бы, простой вопрос и на него должен быть простой ответ. Однако, этой информации вы не найдёте ни на странице Википедия, ни на странице Русская Википедия. Аналогичная история с англоязычной Википедией. Даже на специальной странице нет.

Забавно, да? Мне пришлось лезть в специальные страницы статистики движка mediawiki, где предлагается скачать дамп Википедии. Только там, в глубине, можно узнать, что архив статей (без обсуждений и картинок) занимает 1.7Gb для русской и 8.7 Gb для английской версий.

Если вы заходите развернуть у себя полную копию Википедии, то вам потребуются еще и картинки. Размер английского архива - 1.3 Тб (примерно 1330 Гб). Информацию о русской версии я не нашел. :(

Но вот есть такая программа - Kiwix - для оффлайн просмотра википедий. Версия Русской Википедии от мая 2011 года с картинками занимает в этой программе 9.5Гб. Английской версии с картинками нет - слишком большой получается объем. Но версия из 45 000 статей от декабря 2010 года с картинками займёт всего 3.7Гб (влезает на одну записываемую болванку dvd).

Так что, если кто-то захочет скачать всю википедию (русскую), то ему потребуется всего 3 DVD диска (стандартных болванок по 4.3 Гб). Английская версия Вики (полностью с картинками) займёт 310 таких болванок, но спокойно влезет на один переносной жесткий диск в 1.5 Тб.

@admin , а сколько весит Pikabu? все сервера в сумме? Очень интересно было бы услышать ответ :) Извини, если отвлек. Если например Война и мир примерно весит 1-1,5 мб. Еб вашу мать

Блять, каждый раз после этой фразы в чьем-либо посте я специально перестаю листать и внимательно с долей укоризны смотрю на пост, как бы спрашивая автора, а не листайдальшевхора ли он?

а чего ей много весить?там текст в основном,который много не весит,та и картинки тоже.Есть еще аудиозаписи,они тоже много не весят Весь интернет весит пять миллионов терабайт или пять тысяч петабайт или пять эксабайт,вот так вот)) Дайте ссыль на последнюю версию русскоязычной википедии :3

@toby3d сейчас сколько весит?

Размер русской оффлайн версии с рутрекера(без мультимедиа файлов) 15,1 гб.Я сомневаюсь в том, что размер википедии 26 гб(он куда больше).А автору-не тырь инфу с МДК, там постят всё без разбору.


Я: слышу случайный исторический факт

Я, спустя 30 минут:

Я: слышу случайный исторический факт Юмор, Википедия, Любознательность, Факты, Жизненно

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной

Перед вами 3D-модели 29 самых известных статуй, созданный человеком за всю историю.

С их помощью мы сможем лучше осознать размеры знакомых нам статуй и к концу списка ещё раз убедиться, какие же фантастические масштабы строительства были освоены человеком.

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Венера Брассемпуйская (Франция) и Венера Виллендорфская (Австрия)

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Писающий мальчик (Брюссель)

Банка с газировкой для сравнения размеров.

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Капитолийская волчица (Рим) и Русалочка (Дания)

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Дискобол (Греция), терракотовый солдат (Китай) и Мыслитель (Франция)

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Человек в углу для сравнения размеров.

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Статуя Давида (Италия) и статуя Авраама Линкольна (США)

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Барельеф на горе Рашмор (США)

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Большой сфинкс (Египет)

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Памятник на холме Мансу (Северная Корея), Колосс Родосский (Греция) и Колосс Нерона (Рим)

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Статуя Христа-Искупителя (Бразилия) и Монумент африканского возрождения (Сенегал)

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Статуя Свободы (США) и Родина-мать (Украина)

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Самолётик в углу для сравнения размеров.

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Лечжун-Сасачжа (Мьянма) и Чжунъюаньская статуя Будды (Китай)

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Все четыре последних вместе

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Какого на самом деле размера известные мировые статуи: наглядное сравнение от небольших до самой крупной Культура, Скульптура, Размер, Сравнение, Фотография, Факты, Интересное, Познавательно, Видео, Длиннопост

Полное видео с путешествием через все статуи:

«Стейк для дам» привел женщин в ярость. А владелец ресторана не будет убирать его из меню

«Стейк для дам» привел женщин в ярость. А владелец ресторана не будет убирать его из меню Стейк, Женщины, Мужчины, Размер, Вес, Их нравы, Ресторан, Гифка, Длиннопост

Небольшой семейный ресторан в Ливерпуле, сам того не желая, прогремел в соцсетях после того, как гастроблогер Вики Эндрюс выложила в Твиттер фото одного из пунктов меню.

«Стейк для дам» привел женщин в ярость. А владелец ресторана не будет убирать его из меню Стейк, Женщины, Мужчины, Размер, Вес, Их нравы, Ресторан, Гифка, Длиннопост

8oz — это 8 унций, то есть 222 грамма. Соответственно, соседние предложения, не для дам, оказались внушительнее: 10 унций (283 грамма), 12 унций (340 граммов) и 16 унций (453 грамма).

В соцсетях незамедлительно бомбануло.

«Стейк для дам» привел женщин в ярость. А владелец ресторана не будет убирать его из меню Стейк, Женщины, Мужчины, Размер, Вес, Их нравы, Ресторан, Гифка, Длиннопост

Владелец ресторанчика Карл до поры вообще не был в курсе этой истории. Ему сообщили об этом журналисты британского Metro. Выяснилось, что этот стейк был в меню ресторана уже пять лет и пользовался огромной популярностью — та-дам! — у девушек. По словам Карла, Ladies' Fillet — одно из самых продаваемых блюд в его заведении в принципе.


Ты понимаешь, что это магазин с игровым мерчем когда 4XL закончился первым.

Ты понимаешь, что это магазин с игровым мерчем когда 4XL закончился первым.


Deep Purple и симфонический оркестр

А вы знали, что Deep Purple в 1969 году первые в мире из рок-групп выступили совместно с симфоническим оркестром?

Издатели Deep Purple привлекли к сотрудничеству композитора Малкольма Арнольда, оскаровского лауреата: он должен был осуществлять общее наблюдение за ходом работы, после чего встать за дирижёрский пульт. Безоговорочная поддержка Арнольдом проекта, который многие считали сомнительным, в конечном итоге и обеспечила успех.

Гора Олимп, которая на Марсе

Гора Олимп, которая на Марсе Википедия, Марс, Горы, Интересное, Факты, Длиннопост, Внеземные вулканы

Хочу познакомить Вас с Горой Олимп(Марс)-Самой высокой горой в мире Солнечной Системе и объектом фапа всех альпинистов самым крупным вулканчиком!

Гора Олимп, которая на Марсе Википедия, Марс, Горы, Интересное, Факты, Длиннопост, Внеземные вулканы

Несомненно, это самая крутая гора, которая обладает парочкой абсолютных рекордов. Например, длина вулканической кальдеры Олимпа — 85 км, ширина — 60 км. Олимп занимает столь большую площадь, что его невозможно увидеть полностью с поверхности планеты (дистанция, необходимая для обозрения вулкана, столь велика, что он будет скрыт из-за кривизны поверхности). Поэтому полный профиль Олимпа можно увидеть только с воздуха или орбиты. Соответственно, если встать на самой высшей точке вулкана, то его склон уйдёт за горизонт. Короче, он очень крутой и круче него только этот Чак Норрис ёжик.

Гора Олимп, которая на Марсе Википедия, Марс, Горы, Интересное, Факты, Длиннопост, Внеземные вулканы

Немного Фактов:

Диаметр кратера 85 000 м.

Глубина кратера 3000 м.

Высота вершины 21 229 м.

Относительная высота 21 200 м.

Гора Олимп, которая на Марсе Википедия, Марс, Горы, Интересное, Факты, Длиннопост, Внеземные вулканы

Гора Олимп, которая на Марсе Википедия, Марс, Горы, Интересное, Факты, Длиннопост, Внеземные вулканы

Еще атмосферное давление на вершине Олимпа составляет лишь 2 % от давления, характерного для среднего уровня марсианской поверхности (для сравнения — давление на вершине Эвереста составляет 25 % от показателя на уровне моря). Учитывая, что на поверхности Марса давление составляет менее 0,01 атмосферы, разреженность среды на вершине Олимпа почти не отличается от космического вакуума.

5 фактов о Википедии, которых вы не знали

Вышедшие к недавнему 15-летию Википедии статьи были похожи на все прочие заметки о самой главной энциклопедии: 2.5 миллиарда посетителей в месяц, почти 40 миллионов статей, почти 300 языков, бла, бла.

Википедия – небольшая компания. В Фонде Викимедиа, который разрабатывает движок и управляет седьмым вебсайтом в мире по посещаемости, работает всего 280 человек.

Википедия гордится тем, что в нее пишут почти на 300 языках. Но только 13 языковых разделов имеют больше 1 000 000 статей, из них 9 – на европейских языках (если к таковым можно отнести английский и испанский). Ещё в 44 разделах – более 100 000 статей (включая разделы на волапюке, эсперанто и латыни). Остальные малы или исчезающе малы. Например, “родная” для автора латвийская википедия поставила себе целью набрать 100 000 статей к 18 ноября 2018 года — в этот день будет праздноваться столетие Латвийской Республики.

Значит ли это, что Википедия плоха? Конечно, нет. По-моему мнению, Википедия — один из самых смелых, странных и непредсказуемых проектов XXI века. Если у вас есть вопросы по тому, как он устроен, попробую ответить на них в комментариях.

Вы замечали, что мы постоянно скачиваем всё больше и больше информации, при этом она сама становится больше. Что я имею в виду - фильм, который раньше каждый из нас с удовольствием смотрел весил 400-600Мб, сейчас же - качество в 2-4Гб считается не очень, а уж если полноценно смотреть в высококачественном разрешении 4К - то конечно же надо скачивать фильм 20-30Гб по размеру и более. А уже не за горами и разрешение 8К и далее. И так со всеми остальными видами - тексты больше, картинки больше - всё больше.

И всё это радостно накапливается в Интернете … Сколько же сейчас там хранится данных, вот конкретно в нашем 2020м году. Оказывается, существует не только множество исследований, но и множество методик, которые пытаются оценить размер Интернета. Но прежде всего, нам придётся разобраться в единицах измерения - ибо конечно же Гигабайты и Терабайты в этом нам не помогут :)

Йоттабайт это очень много

Итак, как всем прекрасно известно, минимальный размер информации это 1 бит - то есть 0 или 1, 8 бит нам дают 1 байт и вот после этого и начинается прирост размера измерений почти на 1000, точнее на 1024 - связано это с тем, что 1024 это 2 в 10 степени. Отсюда и появляются некруглые итоговые значения. Кстати математики придумали гораздо большее количество названий большим и ОЧЕНЬ большим числам .

В Интернете нас более 4.5 миллиардов

Итак, прежде всего немного статистики - общее количество пользователей Интернета - более 4.5 миллиардов, более 1.5 миллиардов сайтов. Ежедневно мы шлём более 237 миллиардов электронных писем, более 705 миллионов постов в Твиттере, более 6 миллиардов видео просмотрено на YouTube. Живую статистику можно посмотреть прям здесь . А вот сколько именно данных создаёт каждый из нас - можно почитать здесь .

Каков же размер Интернета?

Итак, сколько же действительно данных в Интернете. На текущий размер ежегодный прирост данных в Интернете оценивается примерно в 1,1 Зеттабайт, что как мы помним из таблицы равно около 1,2 миллиарда терабайт данных. В целом же общий размер Интернета можно выразить в диапазоне от 2 до 4 Зеттабайт данных. И в целом если вдруг захочется скачать весь Интернет - то сегодня на хорошей скорости это потребует около 11 миллиардов лет.

А сколько же весит Интернет?

И вот это самый интересный вопрос - оказывается это можно посчитать :) Как мы помним, вся информация состоит из бит - то есть нулей и единиц и если 0 это просто отсутствие чего-то, то единица это фактически заряженный конденсатор - микроскопический и при этом содержит около 40.000 электронов - это очень мало, но они уже что-то весят! Масса электрона составляет 9,11 * 10⁻³¹ кг. Принимая, что примерно 0 и 1 одинаковое количество умножим на общий размер Интернета получаем, что он весит сейчас от 0,0000005 грамм до 0,0000015 грамм - немного не правда ли :)


Мы уже привыкли к постоянному и безудержному росту объёма информации в сети. Остановить или замедлить этот процесс никому не под силу, да и смысла в этом нет. Все знают, что интернет огромен, как по количеству данных, так и по поголовью сайтов. Но насколько он велик? Можно ли как-то оценить, хотя бы приблизительно, сколько петабайт бегает по кабелям, опутывающим планету? Сколько сайтов ждут посетителей на сотнях тысяч серверов? Этим вопросом задаются многие, в том числе и учёные, которые пытаются разработать подходы к оценке безбрежного моря информации, называемого интернетом.

Всемирная сеть — очень оживлённое место. Согласно сервису Internet Live Stats, каждую секунду в Google делается более 50 000 поисковых запросов, просматривается 120 000 видео на Youtube, отправляется почти 2,5 млн электронных писем. Да, весьма впечатляет, но всё же эти данные не позволяют в полной мере представить себе размеры интернета. В сентябре 2014 года общее количество сайтов перевалило за миллиард, и сегодня их примерно 1,018 млрд. А ведь здесь ещё не подсчитана так называемая «глубокая паутина» (Deep Web), то есть совокупность сайтов, не индексируемых поисковиками. Как указывается на Википедии, это не синоним «тёмной паутины», к которой в первую очередь относятся ресурсы, на которых ведётся всевозможная противоправная деятельность. Тем не менее, контент в «глубокой паутине» может быть как совершенно безобидным (например, онлайновые базы данных), так и совершенно непригодным для глаз законопослушной публики (к примеру, торговые площадки чёрного рынка с доступом только через Tor). Хотя Tor’ом пользуются далеко не только нечистые на руку люди, но и вполне чистые перед законом пользователи, алчущие сетевой анонимности.

Конечно, вышеприведённая оценка численности веб-сайтов является приблизительной. Сайты возникают и исчезают, к тому же размеры глубокой и тёмной паутин определить практически невозможно. Поэтому даже приблизительно оценивать размеры сети по этому критерию весьма непросто. Но одно несомненно — сеть постоянно растёт.

Всё дело в данных

Если одних только веб-сайтов более миллиарда, то отдельных страницы гораздо больше. Например, на ресурсе WorldWideWebSize представлена оценка размера интернета именно по количеству страниц. Методика подсчёта разработана Морисом де Кундером (Maurice de Kunder), опубликовавшим её в феврале этого года. Вкратце: сначала система осуществляет поиск в Google и Bing по списку из 50 распространённых английских слов. На основании оценки частоты этих слов в печатных источниках полученные результаты экстраполируются, корректируются, вводится поправка на совпадения результатов по разным поисковикам, и в результате получается некая оценка. На сегодняшний день размер интернета оценивается в 4,58 млрд отдельных веб-страниц. Правда, речь идёт об англоязычном сегменте сети. Для сравнения, там же указан размер голландского сегмента — 225 млн страниц.

Но веб-страница в качестве единицы измерения — вещь слишком абстрактная. Куда интереснее оценить размер интернета с точки зрения объёма информации. Но и здесь есть нюансы. Какую именно информацию считать? Передаваемую или обрабатываемую? Если, к примеру, нас интересует информация передаваемая, то и здесь можно считать по-разному: сколько данных может быть передано за единицу времени, или сколько передано фактически.

Одним из способов оценки циркулирующей в интернете информации является измерение трафика. Согласно данным Cisco, к концу 2016 года по всему миру будет передано 1,1 зеттабайта данных. А в 2019 году объём трафика удвоится, достигнув 2 зеттабайт в год. Да, это ОЧЕНЬ много, но как можно попытаться представить себе 10 21 байт? Как услужливо подсказывается в инфографике от той же Cisco, 1 зеттабайт эквивалентен 36 000 лет HDTV-видео. И понадобится 5 лет для просмотра видео, передаваемого по миру каждую секунду. Правда, там было предсказано, что этот порог трафика мы перейдём в конце 2015, ну ничего, немного не угадали.

В 2011 году было опубликовано исследование, согласно которому, в 2007 году человечество хранило на всех своих цифровых устройствах и носителях примерно 2,4 х 10 21 бит информации, то есть 0,3 зеттабайта. Суммарная вычислительная мощность мирового парка вычислительных устройств «общего назначения» достигала 6,4 х 10 12 MIPS. Любопытно, что 25% от этой величины приходилось на игровые приставки, 6% — на мобильные телефоны, 0,5% — на суперкомпьютеры. При этом суммарная мощность специализированных вычислительных устройств оценивалась в 1,9 х 10 14 MIPS (на два порядка больше), причём 97% приходилось на… видеокарты. Конечно, с тех пор прошло целых 9 лет. Но очень примерно оценить текущее положение дел можно исходя из того, что за период 2000-2007 среднегодовой рост объёмов хранимой информации составил 26%, а вычислительной мощности — 64%. Учитывая развитие и удешевление носителей, а также замедление прироста вычислительной мощности процессоров, предположим, что количество информации на носителях растёт на 30% в год, а вычислительная мощность — на 60%. Тогда объём хранимых данных в 2016 году можно оценить на уровне 1,96 х 10 22 бит = 2,45 зеттабайта, а вычислительную мощность персональных компьютеров, смартфонов, планшетов и приставок на уровне 2,75 х 10 14 MIPS.

В 2012 году появилось любопытное исследование количества используемых на тот момент IPv4-адресов. Изюминка в том, что информация была получена с помощью глобального сканирования интернета силами огромной хакерской ботнет-сети из 420 тыс. узлов.


После сбора информации и алгоритмической обработки выяснилось, что одновременно активными были около 1,3 млрд IP-адресов. Ещё 2,3 млрд бездействовали.

Физическое воплощение

Несмотря на восход цифрового века, для многих из нас биты и байты остаются понятиями несколько абстрактными. Ну, раньше память измеряли мегабайтами, теперь гигабайтами. А что если попробовать представить размер интернета в каком-то вещественном воплощении? В 2015 году двое учёных предложили использовать для оценки настоящие бумажные страницы А4. Взяв за основу данные с вышеупомянутого сервиса WorldWideWebSize, они решили считать каждую веб-страницу эквивалентной 30 страницам бумажным. Получили 4,54 х 10 9 х 30 = 1,36 х 10 11 страниц А4. Но с точки зрения человеческого восприятия это ничем не лучше тех же байтов. Поэтому бумагу привязали к… амазонским джунглям. Согласно расчёту авторов, для изготовления вышеуказанного количества бумаги нужно 8 011 765 деревьев, что эквивалентно 113 км 2 джунглей, то есть 0,002% от общей площади амазонских зарослей. Хотя позднее в газете Washington Post предположили, что 30 страниц — слишком много, и одну веб-страницу правильнее приравнять к 6,5 страницам А4. Тогда весь интернет можно распечатать на 305,5 млрд бумажных листов.

Но всё это справедливо лишь для текстовой информации, которая занимает далеко не самую большую долю от общего объёма данных. Согласно Cisco, в 2015 году на одно только видео приходилось 27 500 петабайт в месяц, а совокупный трафик веб-сайтов, электронной почты и «данных» — 7 700 петабайт. Немногим меньше пришлось на передачу файлов — 6 100 петабайт. Если кто забыл, петабайт равен миллиону гигабайт. Так что амазонские джунгли никак не позволят представить объёмы данных в интернете.

В упомянутом выше исследовании от 2011 года предлагалось визуализировать с помощью компакт-дисков. Как утверждают авторы, в 2007 году 94% все информации было представлено в цифровом виде — 277,3 оптимально сжатых эксабайта (термин, обозначающий сжатие данных с помощью наиболее эффективных алгоритмов, доступных в 2007 году). Если записать всё это богатство на DVD (по 4,7 Гб), то получим 59 000 000 000 болванок. Если считать толщину одного диска равной 1,2 мм, то эта стопка будет высотой 70 800 км. Для сравнения, длина экватора равна 40 000 км, а общая протяжённость государственной границы России — 61 000 км. Причём это объём данных по состоянию на 2007 год! Теперь попробуем таким же образом оценить общий объём трафика, который прогнозируется на этот год — 1,1 зеттабайта. Получим стопку DVD-дисков высотой 280 850 км. Тут уже впору переходить на космические сравнения: среднее расстояние до Луны составляет 385 000 км.

Другая аналогия: общая производительность всех вычислительных устройств в 2007 году достигала 6,4 х 10 18 инструкций/сек. Если принять, что в человеческом мозге 100 млрд нейронов, каждый из которых имеет 1000 связей с соседними нейронами и посылает до 1000 импульсов в секунду, то максимальное количество нейронных импульсов в мозге равно 10 17 .


Для измерения длины есть такие единицы, как миллиметр, сантиметр, метр, километр. Известно, что масса измеряется в граммах, килограммах, центнерах и тоннах. Бег времени выражается в секундах, минутах, часах, днях, месяцах, годах, веках. Компьютер работает с информацией и для измерения ее объема также имеются соответствующие единицы измерения.

Мы уже знаем, что компьютер воспринимает всю информацию через нули и единички.

бит и байт минимальные единицы измерения информации

Бит – это минимальная единица измерения информации, соответствующая одной двоичной цифре («0» или «1»).

Байт состоит из восьми бит. Используя один байт, можно закодировать один символ из 256 возможных (256 = 2 8 ). Таким образом, один байт равен одному символу, то есть 8 битам:

1 символ = 8 битам = 1 байту.

Кроме бита и байта, конечно же, есть и другие, более крупные единицы измерения информации.

Таблица байтов:

1 Кб (1 Килобайт) = 2 10 байт = 2*2*2*2*2*2*2*2*2*2 байт =
= 1024 байт (примерно 1 тысяча байт – 10 3 байт)

1 Мб (1 Мегабайт) = 2 20 байт = 1024 килобайт (примерно 1 миллион байт – 10 6 байт)

1 Гб (1 Гигабайт) = 2 30 байт = 1024 мегабайт (примерно 1 миллиард байт – 10 9 байт)

1 Тб (1 Терабайт) = 2 40 байт = 1024 гигабайт (примерно 10 12 байт). Терабайт иногда называют тонна.

1 Пб (1 Петабайт) = 2 50 байт = 1024 терабайт (примерно 10 15 байт).

1 Эксабайт = 2 60 байт = 1024 петабайт (примерно 10 18 байт).

1 Зеттабайт = 2 70 байт = 1024 эксабайт (примерно 10 21 байт).

1 Йоттабайт = 2 80 байт = 1024 зеттабайт (примерно 10 24 байт).

В приведенной выше таблице степени двойки (2 10 , 2 20 , 2 30 и т.д.) являются точными значениями килобайт, мегабайт, гигабайт. А вот степени числа 10 (точнее, 10 3 , 10 6 , 10 9 и т.п.) будут уже приблизительными значениями, округленными в сторону уменьшения. Таким образом, 2 10 = 1024 байта представляет точное значение килобайта, а 10 3 = 1000 байт является приблизительным значением килобайта.

Такое приближение (или округление) вполне допустимо и является общепринятым.

Ниже приводится таблица байтов с английскими сокращениями (в левой колонке):

10 3 b = 10*10*10 b= 1000 b – килобайт

10 6 b = 10*10*10*10*10*10 b = 1 000 000 b – мегабайт

10 9 b – гигабайт

10 12 b – терабайт

10 15 b – петабайт

10 18 b – эксабайт

10 21 b – зеттабайт

10 24 b – йоттабайт

Выше в правой колонке приведены так называемые «десятичные приставки», которые используются не только с байтами, но и в других областях человеческой деятельности. Например, приставка «кило» в слове «килобайт» означает тысячу байт. В случае с километром она соответствует тысяче метров, а в примере с килограммом она равна тысяче грамм.

Возникает вопрос: есть ли продолжение у таблицы байтов? В математике есть понятие бесконечности, которое обозначается как перевернутая восьмерка: ∞.

Понятно, что в таблице байтов можно и дальше добавлять нули, а точнее, степени к числу 10 таким образом: 10 27 , 10 30 , 10 33 и так до бесконечности. Но зачем это надо? В принципе, пока хватает терабайт и петабайт. В будущем, возможно, уже мало будет и йоттабайта.

Напоследок парочка примеров по устройствам, на которые можно записать терабайты и гигабайты информации.

Есть удобный «терабайтник» – внешний жесткий диск, который подключается через порт USB к компьютеру. На него можно записать терабайт информации. Особенно удобно для ноутбуков (где смена жесткого диска бывает проблематична) и для резервного копирования информации. Лучше заранее делать резервные копии информации, а не после того, как все пропало.

Флешки бывают 1 Гб, 2 Гб, 4 Гб, 8 Гб, 16 Гб, 32 Гб , 64 Гб и даже 1 терабайт.

CD-диски могут вмещать 650 Мб, 700 Мб, 800 Мб и 900 Мб.

DVD-диски рассчитаны на большее количество информации: 4.7 Гб, 8.5 Гб, 9.4 Гб и 17 Гб.

Читайте также: