Компьютер смысл текста понимает или не понимает

Обновлено: 05.07.2024

Автор: Алена Миклашевская

Чем чаще мы читаем с монитора, улавливая смысл по отдельным словам, тем скорее наш мозг привыкнет к этому. Это нормально, скажут нам фанаты новых технологий и современных коммуникаций. Но нейропсихологи придерживаются другого мнения: навыки современного чтения могут сделать нас более примитивным биологическим видом. Психолог Мэриэнн Вольф объясняет это на основе научных данных.

Когда окажетесь в следующий раз в самолете, обратите внимание на летящих с вами людей.

Большинство из нас и не догадывается, что все участники этой сцены связаны одним невидимым процессом.

Нейронная сеть, которая лежит в основе способности мозга к чтению, неуловимо и быстро меняется, и эти изменения чреваты последствиями для всех: от малышей, которые еще не умеют читать, до умудренных опытом взрослых.

Исследования в области нейробиологии показывают, что зарождение письменности более 6 тысяч лет назад повлекло за собой появление новой нейронной сети в мозге наших предков. Эта сеть развилась из очень простого механизма расшифровки базовой информации (например, подсчета голов в стаде) до современного уровня высокоразвитого читающего мозга.

Мои исследования показывают, как современный мозг читающего человека обеспечивает возможность развития самых важных мыслительных и эмоциональных процессов.

Это усвоение знания, рассуждение по аналогии, умозаключения; умение рассмотреть ситуацию с точки зрения других людей и эмпатия; критическое мышление, понимание причин и взаимосвязей.

Исследования, которые проводят специалисты по всему миру, говорят о том, что важнейшим процессам «глубокого чтения» грозит опасность. Она растет по мере того, как мы все активнее переходим на цифровой режим чтения.

И речь здесь не о простой проблеме вроде «чтение с бумажного носителя vs чтение с цифрового носителя». Как пишет профессор Массачусетского технологического института (MIT) Шерри Теркл (Sherry Turkle), как общество мы допускаем ошибку не тогда, когда внедряем высокотехнологичные новшества, а когда не задумываемся о том, какие стороны нашей жизни понесут от этого ущерб.

На текущем этапе развития — между печатной и цифровой культурами — обществу необходимо задуматься: что именно ослабевает в нейронной сети «читающего мозга», что не развивается у наших детей и что мы со всем этим можем поделать?

Из исследований нам известно, что умение читать не заложено в человеке генетически, в отличие от зрительного восприятия изображений. Для развития навыков чтения необходима соответствующая среда. Более того, чтение будет адаптироваться к требованиям конкретной среды — начиная с системы письма и заканчивая свойствами современного носителя текста.

Если преобладающий носитель предполагает стремительные процессы, ориентированные на многозадачность и работу с большими объемами информации (а именно на это ориентируются современные цифровые устройства), на то же будет настраиваться и нейронная сеть, отвечающая за чтение в нашем мозге.

В результате мозг уделяет меньше внимания и времени более медленным процессам глубокого чтения. А они требуют других навыков.

Среди них способности к логическим умозаключениям, критическому мышлению и эмпатии, которые являются неотъемлемой частью обучения в любом возрасте.

Педагоги и исследователи, работающие в области психологии и гуманитарных наук, все чаще подтверждают этот вывод. Преподаватель английской литературы Марк Эдмундсон (Mark Edmundson) утверждает: многие студенты колледжей сознательно избегают изучения классической литературы XIX и XX веков, поскольку у них не хватает терпения читать длинные, насыщенные, сложные тексты.

Однако нас должна беспокоить не столько «когнитивная нетерпеливость» студентов, сколько то, что за ней стоит. А это — потенциальная неспособность значительного числа молодых людей читать с тем уровнем критического мышления, который необходим для понимания глубоких мыслей и доводов, содержащихся в более сложных текстах.

Это не только художественные произведения или научные работы, изучаемые в колледже, но также завещания и юридические договоры с характерными расплывчатыми формулировками.

Использование цифрового носителя может вызвать у старшеклассников и студентов колледжей целый ряд затруднений, которые будут мешать пониманию смысла текста.

Психолог из Ставангера (Норвегия) Анне Манген (Anne Mangen) и ее коллеги исследовали различия в понимании старшеклассниками одного и того же материала в зависимости от того, на каком носителе они его читали.

Манген и ее коллеги задавали ученикам вопросы по содержанию короткого рассказа о любви, крайне популярного в молодежной среде («Jenny, Mon Amour»). При этом половина исследуемой группы читала рассказ на Kindle, другая — в бумажной версии. В итоге ученики, которые знакомились с произведением на бумаге, гораздо лучше поняли смысл, могли обстоятельно излагать подробности и пересказывать сюжет в хронологической последовательности.

Лю Цзимин (Ziming Liu) из Университета Сан-Хосе (США) провел ряд исследований, которые доказывают: новой нормой стало чтение по диагонали, или skimming. При использовании этого навыка из текста «выхватываются» отдельные слова, на основе которых читающий делает выводы о смысле.

У многих читателей траектория движения глаз напоминает букву F или Z. То есть они читают первую строчку, а потом бегло читают разрозненные слова на странице.

Когда мозг ведет себя подобным образом, время на процессы глубокого чтения сокращается. Другими словами, у нас не остается времени для постижения смысловой сложности текста, понимания чувств, вложенных автором, восприятия литературной красоты и формулирования собственных мыслей.

Карин Литтау (Karin Littau) и Эндрю Пайпер (Andrew Piper) отмечают и другое измерение, которым обладает чтение: телесность. Исследователи подчеркивают, что тактильное восприятие при чтении с бумажного носителя добавляет тексту насыщенности и объема, дает ощущение присутствия.

Как отмечает Пайпер, это позволяет лучше усваивать материал при повторном переживании ощущений от чтения. Ученый называет это «технологией повторения». Важность повторения и для молодежи, и для читателей старшего возраста заключается в том, что она дает возможность вернуться назад, проверить и оценить уровень понимания текста.

Когда молодой человек просматривает текст по диагонали на экране, тактильное ощущение присутствия теряется, в итоге эффект мысленного «возвращения в текст» не работает.

Американские исследователи в области медиакоммуникации изучали влияние различных носителей на восприятие информации, особенно у молодежи. Выяснилось, что негативные последствия чтения с экрана могут проявиться уже в 4-5 классах, и сказываются они не только на понимании содержания, но и на развитии эмпатии.

Вероятность того, что критическое мышление, эмпатия и другие процессы глубокого чтения станут «случайными жертвами» цифровой культуры, — это не просто вопрос о преимуществах чтения с бумажных или электронных носителей. Речь об изменении способа и даже цели нашего чтения. И касается это не только молодежи.

Незаметная атрофия критического мышления и эмпатии проявляется у всех нас.

Это сказывается на нашей способности ориентироваться в непрерывном потоке данных. Из-за этого мы склонны обращаться к знакомым источникам непроверенной информации и забывать о ее анализе, и в результате мы становимся уязвимыми для ложной информации и демагогии.

В нейробиологии есть старое правило, которое с годами не теряет актуальности: используй или потеряешь.

Очень многообещающий принцип применительно к критическому мышлению, поскольку оно предполагает наличие выбора. История изменения читающего мозга едва ли завершена.

Мы располагаем научными данными и технологиями, чтобы выявить и скорректировать изменения в стиле нашего чтения, причем еще до того, как эти привычки укоренятся.

Нам необходимо воспитывать новый тип мозга: мозг «двойной грамотности», способный к самому глубокому погружению в смысл текста, независимо от формата носителя. От этого зависит очень многое: способность граждан проверять разные точки зрения и устанавливать истину; способность наших детей и внуков понимать и создавать красоту; способность нас самих вырваться за пределы нынешнего потока информации, чтобы обрести знания и мудрость, которые помогут нашему обществу развиваться.

Участникам конкурса Up Great ПРО//ЧТЕНИЕ нужно научить искусственный интеллект понимать смысл текста. Задача сильно отличается от того, что сегодня демонстрируют GPT-3 и другие системы: они удачно мимикрируют под человека, но на деле не анализируют смысл написанного.

В конкурсе от ИИ-систем требуется прямо противоположное: не притворяться человеком, но помогать нам, дополняя наши навыки анализа текста. Сегодня есть отдельные подходы к фактчекингу и пониманию логических связей, но упаковать все это в единую систему, которая сможет проанализировать текст и указать на ошибки, пока не удалось никому.

По масштабу вызова конкурс ПРО//ЧТЕНИЕ можно сравнить с IBM Watson AI Xprize, Darpa Grand Challenge, Netflix Prize. Каждое из этих соревнований подарило миру десятки новых технологий и подходов к решению прорывных задач. Вот три принципа, которые объединяют эти конкурсы:

  • Технологический барьер. Борьба идет не за разработку лучшего решения, а за достижение результата, который раньше считался невозможным.
  • Неограниченность подходов к решению задачи. Любое решение, которое достигает результата, имеет право на победу в конкурсе. К примеру, в соревновании беспилотников DARPA Grand Challenge наравне участвовали и джипы, и грузовики, и даже мотоцикл.
  • Объективность результата. Победитель конкурса должен в ходе испытаний доказать, что его решение работает и действительно выполняет поставленную задачу.

Эти принципы позволяют собрать в конкурсе десятки разных, подчас неожиданных подходов и дать толчок к развитию каждого из них.

Во время испытаний ИИ-системы участников тестируются на выборке из 500 сочинений ЕГЭ по гуманитарным предметам. Конкурс проводится для текстов на русском и английском языках – можно выбрать один из языков или оба.

На обработку каждого текста ИИ-системой команды отводится не более 60 секунд, включая время на скачивание и загрузку файлов. После завершения испытаний аналогичную задачу предстоит решить педагогам — их лимит времени тоже ограничен. Затем специальная ИТ-платформа испытаний сравнивает разметки ИИ-систем и преподавателей и выявляет расхождения.

Конкурс проходит в несколько циклов до конца 2022 года. Испытания проводятся регулярно до тех пор, пока одна из команд не покажет результат не хуже человека.

Для того, чтобы сравнивать способности ИИ-систем с преподавателями, нужно было разработать метрику сравнения. При этом быстро стало ясно, что невозможно создать эталонный датасет, в котором содержатся правильно размеченные ошибки: даже эксперты ЕГЭ высокой квалификации зачастую не могут договориться о том, является ли какое-то утверждение ошибкой или нет. Несмотря на все критерии и методики, задача очень субъективная.

Это привело к тому, что во время подготовки конкурса было решено в принципе отказаться от эталонной разметки. Вместо этого все сочинения проверяют реальные преподаватели - эксперты ЕГЭ. Минимум два, а в случае большого процента расхождений - три (что тоже соответствует методике проверки ЕГЭ - каждое экзаменационное сочинение проверяется 2-3 раза):

· Если все эксперты сошлись в том, что в тексте есть ошибка, то мы считаем, что и ИИ должен на нее указать.

· Если один эксперт указал на ошибку, а остальные считают, что ее там нет, то обе трактовки (а также все, что находится в поле между ними) уместны для ИИ.

· Если эксперты нашли ошибку, но не сошлись в типе или локализации фрагмента (не совпадают начало и конец ошибки), то и для ИИ есть достаточно широкий коридор того, как корректно разметить ошибку.

Таким образом для сочинений, в которых достаточно простые и однозначно трактуемые человеком ошибки, есть почти однозначная разметка, которую ИИ должен близко повторить. А для работ, в оценке которых эксперты расходятся значительно, любая достаточно близкая разметка будет считаться правильной.

Вот пример с первого цикла испытаний конкурса, который прошел в ноябре 2020 года:

Видно, что эксперты очень сильно разошлись в оценке фрагмента сочинения по истории. Первое предложение один из экспертов посчитал ошибкой (недостаточно точно указана причина исторического события или процесса), а второй отметил как верное. То есть они одинаково выделили фрагмент текста, но, по мнению одного эксперта, этот фрагмент является основанием снизить оценку за работу, а по мнению второго – наоборот, повысить (в сочинениях ЕГЭ, чтобы получить максимальный балл, ученик должен указывать причины событий, приводить релевантные исторические примеры и т.п.).

Математически сопоставление разметок выглядит следующим образом. По двум разметкам попарно сопоставляются все выявленные фрагменты по метрике расстояния Жаккара:

Осуществляется перебор всех вариантов и выбирается такое попарное сопоставление, которое приводит к максимальному соответствию разметок друг с другом.

В результате этого действия мы получаем метрику парного соответствия разметок - среднюю точность разметки.

На базе этой промежуточной метрики осуществляется вычисление итоговой метрики - относительной точности алгоритмической разметки (ОТАР), которая определяется как отношение средней точности алгоритмической разметки (СТАР) к средней точности экспертной разметки (СТЭР):

Такой подход позволяет создать достаточно гибкую систему: чем больше расхождение между экспертами-людьми (а значит - ниже СТЭР), тем большее отклонение от средней экспертной разметки может допустить ИИ. А в случае абсолютно идентичных экспертных разметок (в датасете сейчас таких всего 0,3%), единственная разметка, которая может получить 100% результат, - точно такая же идентичная разметка ИИ.

Для победы в конкурсе значение ОТАР участника должно составить не менее 100%. За счет того, что СТАР может быть выше СТЭР, то по хорошо размеченному сочинению вполне возможно получить ОТАР выше 100%, тем самым компенсируя ОТАР ниже 100% по другим сочинениям.

Обучающие выборки конкурса лежат в открытом доступе на сайте. Датасеты собираются из баз данных ЕГЭ. Это школьные работы, написанные при подготовке к экзаменам или непосредственно на самом экзамене. Часть текстов собирается сразу в электронном виде, другая часть – оцифровывается.

Разметку текстов в специальном веб-интерфейсе – «Разметчике» - проводят реальные учителя в соответствии со своим профилем. Каждый из них имеет статус сертифицированного эксперта ЕГЭ. В среднем преподаватель тратит на проверку одного текста от 5 минут до получаса.

Пример экспертной разметки сочинения по обществознанию в «Разметчике».

Сейчас в нашем датасете несколько тысяч размеченных текстов. В рамках подготовки испытаний мы планируем довести официальный датасет до 12 000 сочинений по каждому языку. Это больше 24 000 разметок на один язык. Но, конечно, даже этого количества недостаточно для действительно эффективного обучения нейросетевых решений. Поэтому мы готовим к запуску специальный проект по краудсорсингу датасета, который позволит в разы увеличить количество файлов и разметок с максимальным сохранением качества.

Специально для конкурса также спроектирована ИТ-платформа, в которую входят различные микросервисы. Помимо модуля «Разметчик», о котором мы рассказали выше, это:

● Личный кабинет участника, откуда команды могут получить доступ ко всем датасетам, к процессу квалификации и испытаний.

● Модуль «Финал» - микросервис, который во время испытаний одновременно отдает файлы всем участникам и потом их получает. Модуль логирует весь процесс, чтобы впоследствии судьи могли разобраться в спорных ситуациях, которые нельзя исключать во время испытаний.

Одно из крупных улучшений ИТ-платформы, которое ожидается в ближайшее время, - реализация бейзлайн решения, которое позволит командам сосредоточиться на совершенствовании алгоритмов своего ИИ. Бейзлайн же даст хорошую основу для постройки командами модуля, который реализует техническую часть по получению файла от платформы и отсылке его обратно.

Также в рамках ИТ-платформы будет реализован блок, который позволит внешним экспертам, не связанным с конкурсом, проводить разметку текстов и тем самым пополнять имеющийся датасет. Этот же модуль может стать хорошим инструментом для учителей для автоматизации удаленной работы с учениками, которые смогут получать быстрый и наглядный отклик от преподавателя не только во время подготовки к ЕГЭ, но и в течение всего процесса обучения.

Конкурс ПРО//ЧТЕНИЕ организован РВК, Фондом «Сколково» и АСИ в рамках Национальной технологической инициативы. Технический партнер – Центр компетенций НТИ "Искусственный интеллект", МФТИ. В конкурсе задействованы следующие группы экспертов:

● Профильные эксперты - преподаватели, каждый из которых имеют статус ведущего эксперта ЕГЭ или даже председателя предметной комиссии (координируют работу экспертов ЕГЭ и решают спорные случаи в процессе проверки экзаменационных работ). У них накоплен обширный практический опыт по разбору сложных случаев в текстах по соответствующему предмету.

● Технические судьи - контролируют и фиксируют прохождение испытаний и соблюдение всех формальных процедур, чтобы гарантировать равные условия для всех участников.

● Техническая комиссия - ведущие специалисты по Data Science с многолетним опытом, которые верифицируют результаты работы ИИ-систем участников. При разборе неоднозначных ситуаций, которые, естественно, возникают во время проведения такого сложного конкурса, организаторы прибегают к помощи технической комиссии.

Первый цикл испытаний ПРО//ЧТЕНИЕ закончился в ноябре прошлого года. Из 180 заявок квалификацию прошли 11 команд, включая разработчиков DeepPavlov, «Антиплагиат», «Нейросети Ашманова», МФТИ, МГУ, РХТУ.

Первые испытания завершились без победителя - в этот раз ни одна из команд не смогла достичь результата, соответствующего уровню педагогов. При этом участники разделили 20 млн руб. призового фонда в специальных номинациях «Грамматика» и «Грамматика.ENG».

Ближе всего по точности текстов на английском языке оказалась команда DeepPavlov «НейроЧтение» со значением ОТАР в 84,5%. Для текстов на русском языке – команда «Антиплагиат», их значение ОТАР составило 57,8%. На данном этапе ИИ-ассистенты участников наиболее успешно справились с выявлением грамматических и речевых ошибок. Сложности чаще всего возникают при определении логических ошибок. Подробнее о том, какие подходы используют команды-лидеры, можно прочитать здесь.


В данный момент вы не можете посмотреть или раздать видеоурок ученикам

Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобрев в каталоге.

Получите невероятные возможности



2. Раздавайте видеоуроки в личные кабинеты ученикам.


3. Смотрите статистику просмотра видеоуроков учениками.

Конспект урока "Текстовые данные"

Здравствуйте, мальчики и девочки. Это снова я, ноутбук Самсоша.


Мы начинаем новый интересный раздел «Информация и данные» с темы «Текстовые данные». Цель нашей встречи сегодня – разобраться, то есть понять, что такое текст, текстовая информация и текстовые данные.

Ребята, посмотрите, вот огород, вот репка, дедка, бабка, внучка, жучка, кошка, мышка. Глядя на рисунок, мы сразу можем сказать, что он связан именно со сказкой «Репка». Рисунки – это способ представления информации на носителе. Это могут быть иллюстрации к сказке или просто какой-нибудь рисунок. Глядя на любое изображение, мы можем получить информацию. Эта – корзина с овощами. Это – лист клёна. Вот зонтик. Девочка играет на скрипке. Школьный класс. Это – велосипед. Кот. Рисунки несут образную (наглядную) информацию. Это значит, что, увидев рисунок, мы сразу можем представить предмет, который изображён, - его размер, какой он на ощупь, его запах. Такую образную информацию может получить даже тот, кто не умеет читать, ну или ещё читает не очень хорошо. Поэтому в книгах для маленьких детей всегда очень много рисунков.

Но вы-то уже умеете читать, поэтому я предлагаю вам прочитать вот этот отрывок из одного стихотворения.

В нашем классе

Нет лентяев,—

Только Вася

Он приходит на урок,

Засыпает, как сурок.

Некоторые из вас, возможно, узнали отрывок из стихотворения «Считалка» Самуила Яковлевича Маршака и помнят, о чём там шла речь. Но даже по этому отрывку можно представить себе эту картинку. Разумеется, если умеешь читать.

Текст – это способ представления информации в виде последовательности знаков: букв и других знаков.

И с помощью текста, и с помощью рисунка мы можем закодировать информацию. А для чего? Как вы думаете, ребята? Для того, чтобы сохранить её или передать кому-нибудь. В отличие от рисунков, текстовая информация не наглядная. Она закодирована, «спрятана» в знаки. Не удивляйтесь, интервал между словами – это тоже знак, он помогает отделять слова друг от друга. Вы уже знаете, что закодированная информация – это данные. Значит, если информация закодирована текстом, то это текстовые данные.

Читать – это значит, декодировать, то есть расшифровывать информацию.

Я уже говорил, что читать (получать информацию из текста) могут только те, кто умеет читать. Посмотрите на этих двух мальчиков.


Почему же они в замешательстве. Они что, читать не умеют? – наверное, подумали вы. Нет. Читать они умеют. Дело в том, что мальчик справа русский по национальности, но надпись на двери написана на английском языке. А он, к сожалению, не знает иностранные языки. А вот мальчик слева приехал из Англии и русский язык он ещё даже не начал учить.

Это значит, что декодировать информацию можно только на языке, который вы знаете. Скажу вам по секрету, профессор Знатоков декодирует информацию на четырёх языках. Наш профессор полиглот — это человек, который знает много языков.

Ребята, как вы думаете, а компьютер смысл текстов понимает?

Некоторые из вас, наверное, думают, что да.

Вот, например, мы что-нибудь ищем в Интернете и получаем информацию именно по своему запросу.


Но тут я вас разочарую, компьютер не понимает смысл текстов. Он работает с данными формально, то есть просто выполняет команды, не понимая их. Чтобы компьютер мог работать с текстом, нужно закодировать знаки текста особым образом. Как? Об этом мы узнаем через несколько уроков в этом же разделе.

А сейчас я предлагаю выполнить несколько заданий.

В первом из них надо разделить то, что вы видите на экране, на две группы - текстовую и образную информацию.


Итак, к текстовой информации относится то, что закодировано буквами (знаками).

Образная информация – это, конечно, же все изображения (рисунки).

Вставьте в предложения пропущенные слова. Необходимые слова выбирайте из предложенных. Обратите внимание на то, что некоторые слова надо изменить так, чтобы в предложении они были связаны с другими словами по смыслу.

Проверяем, что должно было получиться.

Рисунки несут образную информацию.

Текстовая информация не образная, а знаковая.

Текст – это текстовые данные.

Ну вот мы и познакомились с темой «Текстовые данные». Теперь надо обязательно подвести итоги.

Текст – это представление информации с помощью знаков

Текстовые данные – это информация, представленная (закодированная) в виде текста.

Текст, в отличие от рисунка, не обладает наглядностью

И, как всегда, в конце урока, заполняем наш словарь.

Наглядность. Данным свойством обладают только рисунки.

Текстовые данные. Информация, представленная в виде текста

Декодирование текста – чтение.

Ну вот, ребята, задания выполнены, итоги подведены, словарь заполнен. А это значит пришла пора сказать мне: «До свидания! До скорой встречи, друзья!»

До сих пор мы вели речь только о том, чтобы записать в память некое число . Если у меня есть 5 книг, я записываю в память число 5, и считаю, что сохранил информацию о книгах. Но эта информация относится только к количеству. А что насчет качества? Что насчет синего или красного цвета, или названия книги? Название – это текст, написанный буквами, а как сохранить в памяти буквы?

Ответ везде один и тот же –

В компьютерной памяти хранятся только числа. Никаких букв, никаких красных или синих цветов. Только числа.

Легче не стало? Ничего, сейчас разберемся.

Если количество книг мы смогли представить числом 5, то ничто не мешает представить, например, латинскую букву "A" тоже каким-нибудь числом.

Латинская буква "A" будет обозначаться числом 65 . (Это действительно так, а почему – расскажу позже.)

Итак, чтобы записать в память букву "A", нужно записать число 65. Всё, проблема решена. Присвоены числа и другим буквам: B = 66, C = 67, D = 68 и так далее. Теперь мы можем записать в память любую букву в виде числа.

Если стоит задача сохранить синий цвет, его тоже можно перевести в число. Например, тоже 65 :) Это будет означать, что по шкале от 0 (самый тёмный) до 255 (самый яркий) яркость синего цвета составляет 65.

Таким образом, мы можем сохранить в памяти: 65 как количество чего-нибудь, 65 как букву "A", 65 как яркость синего цвета.

Три абсолютно разных сущности, которые в памяти хранятся как одно и то же число 65. Три абсолютно разных сущности, которые в памяти хранятся как одно и то же число 65.

Если посмотреть на то, что получилось, то мы увидим в памяти просто три байта, и в каждом записано 65 (в двоичном виде 01000001). Но как компьютер понимает, где число, где буква, где цвет?

А это ещё легче. Компьютер ВООБЩЕ НИКАК не понимает, где что. Ему ПЛЕВАТЬ! Для него есть только три числа, записанные в три разных адреса. Кто из них число, кто буква, а кто цвет – известно только нам, и вся ответственность лежит на нас.

Из этого следует одна интересная вещь: в компьютерной памяти мы можем творить любой абсурд. Например, можем сложить букву A и синий цвет. Или сложить число 65 и букву A. Что получится в результате?

65 + A = 130 . Вот это и получится, потому что это всего лишь числа. Компьютеру плевать!

Такие операции с памятью могут быть очень полезны и даже незаменимы (особенно для хакеров), но в основном от программирования требуется обратный эффект – чтобы мы не могли случайно или нарочно сложить цифру с буквой. И языки программирования выступают посредниками между нами и компьютером.

Когда мы пишем на языке программирования, мы заранее объявляем, где у нас число, а где буква, и так далее, и правила языка начинают это всё отслеживать. Мы уже не помещаем свои данные в память напрямую, это делает за нас язык, он как бы ведет учет и знает, где что лежит и как со всем этим обращаться. В большинстве языков программирования существуют следующие типы данных, которые они различают:

  1. Число . Это просто число. Количество книг, температура воздуха и так далее.
  2. Символ . Это один символ вроде буквы "A", или специальный символ типа "%", "@", "$", и т.д. Пробел (" ") тоже считается символом.
  3. Строка . Это любое количество символов, расположенных в памяти подряд друг за другом.

Да-да, чтобы сохранить в памяти строку "Hello world", мы просто подряд, друг за другом, сохраняем символы H,e,l,l,o, ,w,o,r,l,d.

Читайте также: