DeepSeek-R1 объединяет ИИ и периферийные вычисления для промышленного Интернета вещей

Введение

Небольшие очищенные модели DeepSeek-R1 точно настроены с использованием цепочки данных, сгенерированных DeepSeek-R1, отмеченных...теги, наследующие возможности рассуждения R1. Эти тонко настроенные наборы данных явно включают процессы рассуждения, такие как декомпозиция проблемы и промежуточные выводы. Обучение с подкреплением согласовало поведенческие шаблоны дистиллированной модели с шагами рассуждения, сгенерированными R1. Этот механизм дистилляции позволяет малым моделям поддерживать вычислительную эффективность, получая сложные способности рассуждения, близкие к возможностям более крупных моделей, что имеет значительную прикладную ценность в сценариях с ограниченными ресурсами. Например, версия 14B достигает 92% завершения кода исходной модели DeepSeek-R1. В этой статье представлена ​​дистиллированная модель DeepSeek-R1 и ее основные приложения в промышленных периферийных вычислениях, обобщенные в следующих четырех направлениях, а также конкретные случаи реализации:

dc3c637c5bead8b62ed51b6d83ac0b4

Прогностическое обслуживание оборудования

Техническая реализация

Слияние датчиков:

Интеграция данных о вибрации, температуре и токе с ПЛК через протокол Modbus (частота дискретизации 1 кГц).

Извлечение признаков:

Запустите Edge Impulse на Jetson Orin NX для извлечения 128-мерных характеристик временного ряда.

Вывод модели:

Разверните модель DeepSeek-R1-Distill-14B, введя векторы признаков для генерации значений вероятности неисправности.

Динамическая регулировка:

Выдавайте заказы на техническое обслуживание, если уровень уверенности > 85%, и инициируйте процесс вторичной проверки, если уровень уверенности < 60%.

Соответствующее дело

Компания Schneider Electric внедрила это решение на горнодобывающем оборудовании, что позволило снизить количество ложных срабатываний на 63%, а расходы на техническое обслуживание — на 41%.

1

Запуск модели DeepSeek R1 Distilled на компьютерах InHand AI Edge

Улучшенный визуальный осмотр

Архитектура вывода

Типичный конвейер развертывания:

камера = GigE_Vision_Camera(500fps) # Гигабитная промышленная камера
frame = camera.capture() # Захват изображения
preprocessed = OpenCV.denoise(frame) # Предварительная обработка шумоподавления
defect_type = DeepSeek_R1_7B.infer(preprocessed) # Классификация дефектов
если тип_дефекта != 'нормальный':
PLC.trigger_reject() # Механизм сортировки триггеров

Показатели производительности

Задержка обработки:

82 мс (Jetson AGX Orin)

Точность:

Уровень обнаружения дефектов литья под давлением достигает 98,7%.

2

Выводы DeepSeek R1: победители и проигравшие в цепочке создания стоимости генеративного ИИ

Оптимизация технологического процесса

Ключевые технологии

Взаимодействие на естественном языке:

Операторы описывают аномалии оборудования голосом (например, «Колебание давления экструдера ±0,3 МПа»).

Мультимодальное рассуждение:

Модель генерирует предложения по оптимизации на основе исторических данных оборудования (например, регулировка скорости шнека на 2,5%).

Проверка цифрового двойника:

Проверка параметров моделирования на платформе EdgeX Foundry.

Эффект внедрения

Химический завод BASF внедрил эту схему, что позволило сократить потребление энергии на 17% и повысить качество продукции на 9%.

3

Edge AI и будущее бизнеса: OpenAI o1 против DeepSeek R1 для здравоохранения, автомобилестроения и IIoT

Мгновенный поиск базы знаний

Архитектура Дизайн

Локальная база данных векторов:

Используйте ChromaDB для хранения руководств по оборудованию и спецификаций процессов (внедрение размерности 768).

Гибридный поиск:

Объедините алгоритм BM25 + косинусное сходство для запроса.

Генерация результата:

Модель R1-7B обобщает и уточняет результаты поиска.

Типичный случай

Инженеры Siemens устранили неисправности инверторов с помощью запросов на естественном языке, сократив среднее время обработки на 58%.

Проблемы развертывания и решения

Ограничения памяти:

Использована технология квантования кэша KV, что позволило сократить объем используемой памяти модели 14B с 32 ГБ до 9 ГБ.

Обеспечение производительности в реальном времени:

Стабилизированная задержка единичного вывода до ±15 мс за счет оптимизации CUDA Graph.

Дрейф модели:

Еженедельные инкрементные обновления (передача только 2% параметров).

Экстремальные условия:

Рассчитан на широкий диапазон температур от -40°C до 85°C с уровнем защиты IP67.

5
微信图片_20240614024031.jpg1

Заключение

Текущие затраты на развертывание теперь снизились до $599/узел (Jetson Orin NX), при этом масштабируемые приложения формируются в таких секторах, как производство 3C, сборка автомобилей и энергетическая химия. Ожидается, что непрерывная оптимизация архитектуры MoE и технологии квантования позволит запустить модель 70B на периферийных устройствах к концу 2025 года.

Найти решение для кабеля ELV

Кабели управления

Для BMS, BUS, промышленного, приборного кабеля.

Структурированная кабельная система

Сеть и данные, оптоволоконный кабель, коммутационный шнур, модули, лицевая панель

Обзор выставок и мероприятий 2024 года

16-18 апреля 2024 г. Middle-East-Energy в Дубае

16-18 апреля 2024 г. Securika в Москве

9 мая 2024 г. МЕРОПРИЯТИЕ ПО ЗАПУСКУ НОВЫХ ПРОДУКТОВ И ТЕХНОЛОГИЙ в Шанхае

22-25 октября 2024 г. SECURITY CHINA в Пекине

19-20 ноября 2024 г. CONNECTED WORLD KSA


Время публикации: 07.02.2025