Deep learning: особенности машинного обучения нового времени
Понятие глубокого обучения активно используется в искусственном интеллекте. Этот термин часто сопоставляют с так называемым машинным обучением, но между Machine learning и Deep learning есть существенная разница. Первый тип обучения сейчас используется активнее, но он ограничен в возможностях. Если описать кратко, то для анализа каких-либо данных при Machine learning необходимо задавать шаблон или классифицировать информацию. А вот deep learning-алгоритмы не требуют никакого исходника, так как они работают по принципу нейронный связей, осуществляя гораздо больше операций для поиска всей информации без заданной классификации.
Впервые о deep learning в машинном обучении заговорили чуть более 20 лет назад, но ранее для глубинного обучения ИИ не было технической инфраструктуры. Мощностей компьютеров банально не хватало, чтобы обрабатывать большой объем данных, сравнимый с человеческим мозгом. Но теперь с появлением высокопроизводительных видеопроцессоров это стало возможным.
Раскрытие понятий Deep Learning и AI
Для более точного понимания технологии deep learning в AI следует научиться различать понятия, которые часто между собой путают или сопоставляют. Искусственный интеллект включает в себя и машинное, и глубокое обучение. Оба подхода к поиску и обработке информации компьютерами относятся именно к ИИ, но отличаются между собой реализацией решения.
Например, чтобы научить компьютер идентифицировать лица с камер видеонаблюдения в офисе при машинном обучении нужно сначала загрузить фотографии сотрудников, а каждому из них по фото присвоить имя или номер. Естественно, даже самый умный робот при машинном обучении сам не сможет идентифицировать людей по фото или видео, которое он получает с камеры. Для начала нужно предоставить исходные данные, причем в полном объеме и с абсолютной точностью. Только после этого робот может распознавать модели. И выполнять работу компьютер при машинном обучении будет только ту, которой его научили. Без возможности расширения своих знаний и навыков в геометрической прогрессии.
Как же в таком случае работает глубокое обучение? Computer for deep learning способен расширять знания за счет нейронных сетей. По такому же принципу работает человеческий мозг, но только в больших масштабах. Например, если при глубоком обучении компьютеру предоставить просто фотографии животных, то он сам со временем определит их породу и характеристики. В случае с машинным обучением компьютеру пришлось бы для начала предоставить базу данных со списком видов животных и их фото для сравнения и идентификации. В deep learning models анализируются на основе данных, которые есть в сети Интернет или в специализированной базе данных.
Описанные выше примеры очень простые. На самом деле процесс более сложный и многоуровневый, но за счет применения высокопроизводительных процессоров это происходит достаточно быстро. Например, в глубоком обучении обработка данных осуществляется поэтапно. То есть сначала нейронная сеть реагирует на базовые факторы: изменения цветов, затем уже компьютер определяет геометрические формы и понимает, что перед ним изображение. Затем распознаются точные очертания и так далее.
На самом деле deep learning-примеры более обширны, чем просто идентификация животных по фотографиям. О готовых способах применения технологии DL в искусственном интеллекте можно узнать далее.
Обзор существующих решений
Одно из самых известных решений, в котором используется глубокое обучение, называется DeepFace. С его помощью можно распознавать лица людей с точностью до 97-98%. К сожалению, пока что не всегда глубокое обучение применяется в реальной пользой. Есть много случаев, когда DeepFace используется для подделки видео или фотографий. Наверняка вы видели или слышали о том, как можно на видео изменить лицо актера на какую-то публичную личность. Неопытный пользователь не сразу поймет, что перед ним изображение с DeepFace.
Deep learning engineer работают над расширение возможностей технологии. Уже сейчас ее активно применяют поисковые системы вроде Google. Глубокое обучение используется при переводе текстов, а также при распознавании изображений. Поисковые алгоритмы тоже постоянно улучшаются, становясь более точными и естественными. Здесь тоже не обходится без машинного и глубокого обучения.
Еще в качестве примера можно привести разработку от Google под названием WaveNet. Эта система предназначена для распознавания человеческой речи. IT-инженеры компании взяли за основу более миллиона слов, сказанных голосовому помощнику. На основе этого система с применением глубокого обучения смогла определить правильность расстановки ударения и особенности акцента на разных языках. И уже на основании этого искусственный интеллект смог самостоятельно воспроизводить новые фразы по смыслу с правильным ударением и акцентом. Именно так и происходит обучение голосовых помощников.
Есть и другие яркие примеры активного внедрения DL в быту. Чего стоит только система автопилота или распознавания окружения у автомобилей Tesla или других марок. Беспилотные транспортные средства умеют идентифицировать визуальные контуры, определять тип препятствий и многие другие параметры. Все это было бы невозможно без глубокого обучения.
Как уже было написано выше, широкие возможности для развития этой технологии возникли не так давно. Произошло это за счет распространения и повышения доступности графических процессоров. Поэтому самые передовые технологии в этом направлении есть у nvidia deep learning, AMD и похожих компаний, работающих в направлении разработки GPU.
Компании лидеры deep learning настроены оптимистично в отношении этой технологии, поэтому Facebook, Amazon, Tesla, Google и другие ИТ-корпорации инвестируют миллиарды долларов в развитие глубокого обучения.
Преимущества и недостатки
Однако для объективной оценки deep learning важно сравнивать и преимущества, и недостатки.
Особенности DL:
- Возможность интеграции в существующую ИТ-инфраструктуру;
- Высокий уровень защищенности;
- Широкие возможности обучения с работой исключительно в нужном направлении развития нейронных сетей;
- Множество успешных примеров внедрения глубокого обучения в реальной жизни.
На самом деле преимуществ можно выделить больше. Среди них и более высокая гибкость, и доступ к уже продуманным инструментам обучения на примере Tensorflow, Keras, Pyorch, Caffe, и многое другое.
Но эта технология не лишена и недостатков. Например, пока что трудно защититься от применения системы в неблагоприятных целях. Сейчас становятся распространенными DeepFake и другие аналоги, способствующие созданию фото и видео-материала с наложенными лицами или другими элементами. Это может порочить чью-либо репутацию, провоцируя конфликты.
С точки зрения технической реализации недостатков нет. Однако для полноценного применения технологии требуется мощная компьютерная база на основе GPU. При чем простые мощнейшие видеокарты не подойдут. Нужны специальные линейки, выпускаемые в единичных экземплярах именно для задач, связанных с глубинным обучением.