Что такое данные, обучающие ИИ или глубокое обучение?
По большому счету – это структурированные базы, любая статистическая информация, которая, тем не менее, должна быть помечена, чтобы упростить задачу машине. Например, если речь идет о распознавании на фото коровы, оно должно иметь соответствующую пометку «корова», снимку же противопоставляется фото с пометкой «нет коровы». Система ищет такие закономерности, учится распознавать корреляции, а если предоставить ИИ огромный объем данных из той же сети интернет, мы получаем колоссальные возможности для мозга, не нуждающегося в отдыхе и способного запоминать и систематизировать невероятные объемы информации. Кстати, давно ли вы сталкивались с необходимостью подтвердить, что вы не робот и выбрать на каком-либо сайте картинки, где будут изображены только витрины или светофоры? Давно ли купили что-то через онлайн площадку? Любите проходить тесты «что вы за человек?» в Facebook? Вас можно поздравить – в этот момент вы вносите маленькую лепту в обучение большого ИИ. И кстати, как мы знаем, смартфон, позволивший нам пользоваться таким количеством сервисов, входит в нашу жизнь с первой половины 2000-х годов (первые IBM Simon и Ericsson R380 и, наконец, iPhone 1). Согласитесь, почти 20 лет - достаточно большой срок, для того чтобы мы исправно научились кормить ИИ.
Итак, движущей силой развития ИИ является растущий объем данных. Что это если не соцсети, быстро захватившие весь мир, интернет-магазины, так восторженно принятые жителями мегаполисов и всевозможные сервисы по доставке продуктов, услуг (такси и такие сервисы, как Uber)? Все эти нужные нам в быту ресурсы играли роль «сборщиков данных» поселившихся в наших карманных компьютерах и продолжают свою работу каждую секунду изо дня в день. Именно этим объясняется та сумасшедшая скорость, с которой развиваются две великие цифровые державы США и Китай.
Можно сказать, что если теоретиками по развитию искусственного интеллекта стало США, то главным по внедрению научных разработок в жизнь выступил Китай. Эта держава долго отставала от цивилизации в экономическом плане, но в нужное время правильно использовала свой главный ресурс – дешевую рабочую силу. Не особенно задумываясь над глобальными задачами Китая, решая сугубо свои, сиюминутные, европейские и западные бренды размещали свои производства на их территории. Китайцы создавали гигантский рынок потребления, а заодно учились копировать технологии, модернизировали их, создавая свой рынок, налаживая экспорт, и адаптировали чужеземные продукты под себя. Первое, что научились китайцы в нашу эпоху – это копировать технику, модели, программы, а затем, создавать свои. Да, китайцы быть может не амбициозные ученые, но они отличные инженеры, и превосходные предприниматели. В 2013 году Китай создает альтернативную сеть интернет О2О (онлайн для офлайн), и единую для всех китайцев систему WeChat, которая позволяет миллионам граждан общаться и получать услуги в рамках единого сервиса, одновременно, насыщая его данными. Это как если бы мы с вами получили все интернет-площадки, Watsap, Viber и Facebook в едином приложении, и как если бы владельцем огромного архива данных стал один единственный оператор. Оператор, который точно знает, зачем они ему нужны.
Конечно, вырвавшись вперед, Китай продолжает учиться у США, многие их компании постоянно конкурируют, но тут есть маленькое отличие в глобальной стратегии. Если США пошел путем «захвата» международных рынков, «подсаживая» пользователей всего мира на свое программное обеспечение, платформы, сети и адаптирует свои компании в каждой стране, то Китай сделал ставку на развитие внутреннего рынка (с которым у американских компаний был некий «ментальный» барьер). Получив импульс и поддержку от государства, граждане Поднебесной создали огромную сеть инкубаторов для стартапов, разрабатывающих новые технологичные продукты, и сформировали мощную опору в лице венчурных инвесторов. Первым ярким примером этой эффективной политики стало создание «Проспекта предпринимателей» неким Чжунгуа Дайжи, который создал условия для всех участников процесса создания и внедрения новых технологичных продуктов в одном месте: венчурные инвесторы, стартапы, инкубаторы и сферы услуг образовали единое пространство, позволяющее быстро и эффективно развивать проекты и продукты. Вслед за этой инициативой, создавать условия для инноваций бросились мэры всех городов. Так началась эра независимого развития Китая в сфере ИИ. Продукты, создаваемые стартапами, тут же переносились в реальность и органично встраивались в быт китайцев. Навстречу американским монстрам, захватывающим рынок Китая, вышло множество местных компаний, уже в 2004 году их было свыше 5000, но затем стали выявляться лидеры. Показательным в этой «войне тысяч Групонов» (названной так по имени прародителя торговых сайтов с «купонными распродажами» – компании Groupon) стал проект Ван Сина – он первым переквалифицировался из подражателей в созидатели и организовал целую экосистему новой экономики Китая. Начав с попыток скопировать Facebook и Twitter, он наряду с другими предпринимателями воспроизводил один сервис за другим, пока в 2010 году не создал Meituan – крупнейшую торговую площадку он-лайн, на которой впервые была апробирована схема виртуальной оплаты. В 2015 году компания поглотила своего главного соперника Dianping, к 2017 году сервис выполнял уже 20 млн заказов в день, а число активных пользователей составило 280 млн человек в месяц. И если изначально стартап предлагал исключительно товары, набрав сил, он начал продавать услуги. Таким образом, стали выделяться обладатели самых больших баз данных.
Всего на пути своего становления ИИ должен пройти 4 волны, точнее три из них уже освоены – это интернет и бизнес (коммуникационная и финансовая сферы уже доступны ИИ). Результатом глубокого обучения, по сути, является – ИИ восприятия, обладающий зрением, владеющий речью, способный контактировать с человеком. Все уже успели поссориться с Сири или Алисой, которые для многих стали не только помощниками, но и собеседниками? А ведь они тоже нас изучают – бережно структурируя информацию о наших навыках, привычках, предпочтениях и приоритетах. Эта волна продолжает разворачиваться, а ИИ растет как снежный ком. Алгоритмы уже могут использовать те же механизмы, что и наш мозг, например, они хранят звукозаписи не в виде набора последовательностей единиц и нулей, а распознают и понимают слова, а то и целые предложения, которые запоминают. Мир будет беспрерывно отцифровываться благодаря распространению датчиков, камер, интеллектуальных устройств, пока не будет создана его полная виртуальная копия, осознаваемая искусственным интеллектом. Четвертая волна – автономный ИИ, способный появится только в высокоструктурированной среде, сможет полностью заменить человека, выполняя любые технические задачи, самостоятельно принимая решения на основе своих способностей: зрения, оптимизации данных, статистики и способности включать в свои расчеты не очевидные для человека взаимосвязи. Можно сказать, что ИИ – это та самая идеальная интуиция, которую мы все в себе подозреваем, но не совсем понимаем, как она работает, формируясь в нашем бессознательном. ИИ осуществляет этот процесс легко и осознанно, по прозрачным алгоритмам, превосходя, таким образом, способности человека.
Итак, представим искусственный интеллект, как некое устройство, которое разработали ученые Кремневой долины. Теперь представим, что объем данных – это топливо для этого устройства, и теперь мы увидим, что Китай идет семимильными шагами именно в этом направлении. Почему две гигантские державы так сражаются за это устройство и почему кормить этого виртуального зверя так важно для человечества?