Terrance & Ap11e | Диалог персонажей

Terrance

Привет, Яблочко, ты видела новые чипы с нейросетевыми вычислениями? Я тут думаю над платформой микросервисов, которая будет проводить вычисления в реальном времени на смартфонах. Думаешь, это может стать прорывом для нашего стартапа? Как считаешь?

Ap11e

Звучит захватывающе – edge AI сейчас на пике интереса, но обработка в реальном времени на телефонах тащит за собой немало сложностей. Первое, что бросается в глаза – это время работы от батареи и нагрев, и потребуется очень легкая модель, которая при этом будет достаточно мощной для твоих задач. Если тебе удастся упаковать это в API в стиле микросервиса, чтобы можно было менять модели без глобальных обновлений, это даст тебе серьезное конкурентное преимущество. Не забудь и о приватности данных, особенно если ты обрабатываешь пользовательские данные локально. В целом, вполне реализуемо, но нужно быстро тестировать и дорабатывать и железо, и процесс развертывания. Удачи! Пиши, если столкнешься с какими-то конкретными проблемами.

Terrance

Спасибо за здравый смысл, Эппл. Батарея, тепло, размер модели — понял. Я уже накидываю модульный движок для инференса, который переключает веса на лету, без обновлений по воздуху, просто лёгкий скачивание из защищённого CDN. Конфиденциальность? Она здесь, данные локальные в первую очередь, и федеративное обучение для обновлений. Если возникнут проблемы с нагревом, я подкручу ограничение мощности и попробую притормозить инференс. Следи за новостями, какие новые тренды железа стоит подхватить?

Ap11e

Звучит неплохо – локализация и федерация данных сильно снижают проблемы с приватностью. По аппаратному обеспечению присмотрись к последнему Snapdragon 8 Gen 3 и новому Samsung Exynos 2400, оба предлагают более тесную интеграцию NPU с CPU и технологию 5 нм, что должно помочь с нагревом. Чип Apple A17 Pro тоже интересный – в нем есть нейронный движок, который может обучать модель прямо на устройстве, при этом потребляя в разы меньше энергии, чем предыдущие версии. Если в перспективе получится зацепить iOS – это будет отличный бонус. Что касается архитектуры, Arm продвигает Cortex-A78AE с встроенной безопасностью и ускорением AI, что может пригодиться, если тебе потребуется более детальный контроль. В плане софта не забывай о недавних оптимизациях TensorFlow Lite для ARM Neon и Qualcomm Neural Processing SDK – они помогут выжать максимум производительности из существующего железа. И, напоследок, следи за новой аппаратной акселерацией 3D-стерео графики в грядущих чипах – если получится делать вывод с учетом глубины, это откроет новые возможности для приложений. Удачи, и дай знать, если столкнешься с какими-то узкими местами!

Terrance

Понял, Эппл. Сейчас запускаю тесты производительности Snapdragon 8 Gen 3 и Exynos 2400. И параллельно начну небольшой прототип с TensorFlow Lite на ARM Neon. A17 Pro выглядит очень перспективным вариантом для iOS, поэтому я ещё и отдельную систему сборки для него подготовлю. Сообщу, как получу данные о задержках и энергопотреблении, чтобы мы могли поработать над размером модели и оценить тепловой запас. Спасибо за информацию про GPU с 3D-стерео – если получится реализовать глубинный вывод, это может быть прорыв. Следи за новостями!

Ap11e

Звучит как отличный план. Держи меня в курсе цифр, и тогда подкорректируем размер модели под бюджет вычислительных ресурсов. Буду рада посмотреть, что получится с этим новым подходом к глубине!

Terrance

Конечно, Яблочко. Сообщу, как только будут первые результаты и кривые нагрева. Скоро спишемся!

Ap11e

Звучит отлично—интересно, что получится!

Terrance

Спасибо! Держу в курсе, как только данные появятся. Скоро спишемся!

Ap11e

Поняла, держи в курсе!