Технологии
ИИ Илона Маска теперь может “следить” за людьми через камеры смартфонов
Компания xAI Илона Маска представила новую функцию Grok Vision — это шаг к более тесной интеграции искусственного интеллекта с реальным миром через камеру смартфона.
Теперь чат-бот Grok может «видеть» объекты, на которые направлена камера, и сразу давать пояснения, что именно находится в кадре.
Об этом сообщил разработчик xAI Эбби Амир в социальной сети X. Пока что функция доступна только в iOS-приложении Grok, но уже демонстрирует интересные возможности.
Как работает Grok Vision
В новой голосовой версии Grok можно взаимодействовать с ботом, не печатая запросы — достаточно проговорить их вслух. Камера смартфона становится «глазами» ИИ: пользователь может навести её на предмет, знак, документ, еду или даже пейзаж — и сразу спросить: «Что это?», «Что я вижу?», «Это съедобно?», «Какая тут цена?» и т. д.
По словам техноблогера Марио Науфала, система способна интерпретировать визуальные данные в реальном времени и давать понятные ответы. Это может быть полезно в быту, путешествиях, для распознавания продуктов, инструкций, улиц, документов, интерфейсов и многого другого.
Дополнительные новинки Grok
Кроме визуального режима, в приложении появились: – Многоязычное аудио — ИИ может говорить на нескольких языках, что делает общение доступным для международной аудитории;
– Поиск в реальном времени — Grok подключается к интернету и может давать актуальную информацию по запросам.
Почему это важно
Сочетание зрения, речи и понимания контекста — это то, к чему стремятся почти все разработчики ИИ, и Grok Vision делает шаг именно в этом направлении. Подобные функции, как у ChatGPT-4V или Gemini от Google, постепенно становятся нормой — и внедрение Grok в повседневные сценарии может ускорить переход к «умным» телефонам нового поколения, где ИИ не просто помогает, а «живёт» в камере и разговоре.
Источник: Эбби Амир