Смена интересов информатики в ходе ее развития
Информатика - сравнительно молодая наука с еще не вполне сформировавшимся кругом интересов. За прошедшие с момента ее появления десятилетия (с конца 1940-х гг.) практики обработки информации развивались стремительно, и специалисты по информатике не всегда успевали упорядочивать новые знания.
В послевоенное время приоритетом информатики являлось создание автоматических машин как для целей обороны, так и для повышения эффективности производства.
Бурное развитие компьютеров в 1950-1970-е гг. привело к тому, что повышенное внимание стало уделяться алгоритмам, бинарной логике, развитию языков программирования, структурам данных.
Появление персональных компьютеров, а затем и сетей потребовало от информатики формирования корпуса знаний и навыков, связанных с использованием такой техники. В сферу ее интересов попали операционные и файловые системы, приложения для обработки текстов и изображений, сетевые приложения и т.п.
пользователей глобальных сетей." />
Рисунок 1. Смена научных интересов информатики связана с быстрым ростом пользователей глобальных сетей.
Для нынешнего состояния информатики свойственны следующие характеристики:
- проникновение компьютерных сетей во все сферы человеческой деятельности;
- создание информационных для решения коллективных задач (социальные сети, поисковые системы, торговые площадки, облачные хранилища и т.п.);
- внедрение компьютерных технологий в «интуитивные» области знания (машинный перевод, распознавание образов, синтез речи и т.п.; эта отрасль получила название «Машинное обучение»;
- повышение мощности компьютеров, объединение их в вычислительные кластеры позволяет анализировать сверхбольшие объемы информации (Big Data), что позволяет предсказывать климатические изменения, векторы социального развития, находить новые элементарные частицы в коллайдерах, новые астрономические объекты и т.п.
Некоторые из обозначенных тенденций сохранят актуальность и в ближайшем будущем, становясь новыми объектами изучения информатики. Остановимся на важнейших из них - обработке Больших данных и Машинном обучении.
Большие данные (Big Data)
Большие данные (Big Data) — сверхмассивные объемы информации, накапливающиеся в ходе деятельности крупных корпораций и государств. Обработка Больших данных требует подходов, кардинально отличающихся от поиска по обычным, в том числе крупным базам данных, содержащим "всего лишь" миллионы записей. Количество записей в базах Больших данных измеряется миллиардами и числами более высоких порядков.
Обработка больших данных стала актуальной в связи с лавинообразным ростом информации, которая ежедневно сохраняется в результате деятельности пользователей глобальных сетей.
Рисунок 2. Лавинообразное нарастание генерируемой человечеством информации.
Большие данные характеризуются формулой 4V:
- volume - объем обрабатываемой информации;
- velocity - скорость обработки;
- variety - разновидности обрабатываемых данных;
- veracity - качество и состав результирующих данных.
Существует два типа данных: собранные преднамеренно и накопившиеся как побочный продукт тех или иных информационных процессов. Пример первого случая - интернет-магазины, которые собирают персональные данные о своих пользователях, чтобы осуществлять доставку, сообщать о новых поступлениях и т.д. Во втором случае информация собирается просто потому, что есть возможность ее собрать. Например, сбор информации о реакции потребителя на рекламу, встраиваемую в веб-страницу может представлять собой занесение в базу данных не только сведений о том, когда пользователь кликнул по рекламному объявлению, но и координаты пикселя, на котором в тот момент находился указатель мыши. Накапливаясь, такая, на первый взгляд, избыточная информация со временем позволяет делать неожиданные выводы. Например, может выясниться, что жители северных регионов предпочитают кликать по верхней части объявления, а южных - по нижней. Отсюда можно заключить, что справедливо и обратное: если человек кликнул по верхней части объявления, то велика вероятность того, что он северянин и т.д.
Обработка Больших данных ни в коем случае не означает тотального контроля над информационным обществом. Это лишь получение полезных сведений из "малоценной" информации, которая на очень больших объемах позволяет обнаружить полезные закономерности для целей политологии, социологии маркетинга и т.д.
Машинное обучение (Machine Leraning)
Термин Машинное обучение означает не обучение с помощью машин, а обучение машин, компьютеров и программ для них. Оно подразумевает создание алгоритмов, которые при обработке больших объемов информации могут самонастраиваться на заранее заданный человеком результат. Обрабатывая информацию некоторыми порциями и получая от заказчика отклик - улучшился или ухудшился результат - алгоритм сам решает в каком направлении эволюционировать. Это происходит за счет применения таких технологий, как "дерево решений" и "нейронные сети".
Машинное обучение находит применение в распознавании и синтезе речи и визуальных образов.
В качестве наглядного примера часто приводят эксперимент, в ходе которого компьютеру были предоставлены все произведения художника Винсента ван Гога, обработав которые программа "усвоила" его стиль и научилась преобразовывать любое изображение в подобие такой живописи.
Рисунок 3. Нейронную сеть научили рисовать в стиле ван Гога.
Не трудно заметить, что концепции Больших данных и Машинного обучения взаимосвязаны: чем больше данных будет обработано самообучающимися алгоритмами, тем больше вероятность, что они приблизятся к искомому результату и сгенерируют полезную информацию.