Спецы OpenAI учят ИИ-системы ловкости человечьих рук

    Мы все и не раз удивлялись способностям ботов предприятия Boston Dynamics. Но крайние выработки некоммерческой организации OpenAI, занимающей исследовательскими работами в области технологий искусственного ума, даже на фоне робо-псов Boston Dynamics смотрятся как только совсем другой, наиболее продвинутый уровень. OpenAI предположила Dactyl – ИИ-систему, обученную руководству механизированной рукою. Казалось бы, чего же здесь умопомрачительного? Объясняем. Dactyl – это же система, позволяющая механизированной руке манипулировать физическими объектами на уровне, раньше недосягаемом ни одной ИИ-системе. В перспективе система будет способна наделить бота физическим параметром ловкости.

    Об всеполноценном уровне ловкости механизированного туловища речи пока что и не идет, однако инженеры OpenAI наконец заложили базу.

    Ловкость рук и никакого мошенничества

    Пожалуй, одним из самых великолепных инструментов, которым нас наделила мать-природа являются руки. Конкретно людские руки, а уж ни какие-либо альтернативные, включая конечности самых продвинутых обезьян, способны эдак тонко заведовать собственными пальцами. Инженеры-робототехники всеми силами пробуют адаптировать ловкостью человечьих рук в собственных стальных протеже, однако каких-либо тривиальных и важных подвижек в этом направлении и не существовало уже издавна.

    Разработанная OpenAI система Dactyl создана для, казалось бы, самой простейший задачки, с которой управится даже подросток. Разве для нас мудрено взять в руку, скажем, кубик с нанесенными на каждую из его сторон рисунками и перевернуть его на подходящую сторону? Для нас, граждан, эта задачка и не составляет никакого труда. Для бота – это же реальная пытка. Однако благодаря сильным компам исследователи смогли-таки научить машинку этому трюку всего за 50 часов.

    Все дело в практике

    Обучение системы Dactyl проходило в симуляционной среде. Для сего инженеры сделали цифровую копию руки и расположили ее в компьютерную среду, работающую по принципу рандомизации. Инженеры задали конкретный комплект свойств для окружающей среды (к примеру, объем кубика, гравитацию), а уж потом стали случаем поменять эти переменчивые. Для наиболее скорого обучения системы исследователи сделали сразу же несколько этаких виртуальных рук. Научив Dactyl приспособиться к большенному обилию потенциальных сценариев снутри виртуальной окружающей среды, ученые наделили ИИ-систему опытом, нужным для адаптации к тем самым либо другим сценариям задачки в действительном мире.

    Спустя 50 часов занятий снутри виртуальной посреди ИИ-система научилась заведовать настоящей механизированной рукою и осуществила 50 поставленных перед ней задач: провернуть кубик на ту самую либо иную сторону, и не уронив его и уложившись в 80 секунд для решения единого задания. Для тамошнего дабы система могла «понять» в какую сторону поворачивать кубик, она употребляет комплект фотокамер.

    На собственном официальном медиа-сайте создатели Dactyl объясняют, что в качестве базы для новейшей системы они применили метод OpenAI Five, раньше разработанный для сотворения команды из 5-ти нейронных сетей, могущих командно играться в DOTA 2. Эту цифровую братию мы с вами сможем узреть на ключевом кибертурнире сего года — The International 2018, раз в год проводимом фирмой Valve.

    Эффективность Dactyl обосновывает вероятность сотворения всепригодного метода, могущего учить ИИ-систему на исполнение сразу же пары задач. Основная полезность от этакий способности состоит в том, что в дальнейшем это же упростит и убыстрит сам процесс обучения систем искусственного ума, так как разрабам и не придется с нуля производить и учить новейшие ИИ для решения тамошних либо других новеньких задач.