Deepseek-R1 combinant l'informatique AI et Edge pour l'IoT industriel

Introduction

Les modèles distillés de petite taille de Deepseek-R1 sont affinés à l'aide de données sur la chaîne de pensées générées par Deepseek-R1, marquées de...Tags, héritant des capacités de raisonnement de R1. Ces ensembles de données affinés incluent explicitement des processus de raisonnement tels que la décomposition des problèmes et les déductions intermédiaires. L'apprentissage du renforcement a aligné les modèles de comportement du modèle distillé avec les étapes de raisonnement générées par R1. Ce mécanisme de distillation permet aux petits modèles de maintenir l'efficacité de calcul tout en obtenant des capacités de raisonnement complexes à proximité de celles de modèles plus grands, qui est d'une valeur d'application significative dans les scénarios liés aux ressources. Par exemple, la version 14B atteint 92% de l'achèvement du code du modèle Deepseek-R1 d'origine. Cet article présente le modèle distillé Deepseek-R1 et ses applications principales dans l'informatique Industrial Edge, résumé dans les quatre directions suivantes, ainsi que des cas de mise en œuvre spécifiques:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Entretien prédictif de l'équipement

Mise en œuvre technique

Fusion du capteur:

Intégrez les données de vibration, de température et de courant des PLC via le protocole MODBUS (taux d'échantillonnage de 1 kHz).

Extraction de caractéristiques:

Exécutez l'impulsion de bord sur Jetson Orin NX pour extraire les fonctionnalités de séries chronologiques 128 dimensionnelles.

Inférence du modèle:

Déployez le modèle Deepseek-R1-Distill-14b, entrant des vecteurs de fonctionnalité pour générer des valeurs de probabilité de défaut.

Réglage dynamique:

Déclenchez des ordres de travail de maintenance lorsque la confiance> 85% et lancez un processus de vérification secondaire lorsque <60%.

Cas pertinent

Schneider Electric a déployé cette solution sur les machines miniers, réduisant les taux de faux positifs de 63% et les coûts de maintenance de 41%.

1

Exécution du modèle distillé R1 Deepseek sur les ordinateurs de bord AI inhands

Inspection visuelle améliorée

Architecture de sortie

Pipeline de déploiement typique:

caméra = gige_vision_camera (500fps) # gigabit industriel caméra
frame = caméra.capture () # Capture Image
prétraité = opencv.denise (cadre) # prétraitement de débraillé
fect_type = deepseek_r1_7b.infer (prétraité) # classification des défauts
Si Defect_Type! = 'Normal':
Plc.trigger_reject () # mécanisme de tri de déclenchement

Métriques de performance

Délai de traitement:

82 ms (Jetson Agx orin)

Précision:

La détection des défauts moulés par injection atteint 98,7%.

2

Implications de Deepseek R1: gagnants et perdants dans la chaîne de valeur générative de l'IA

Optimisation du flux de processus

Technologies clés

Interaction du langage naturel:

Les opérateurs décrivent les anomalies de l'équipement via la voix (par exemple, "Fluctuation de la pression d'extrudeuse ± 0,3 MPa").

Raisonnement multimodal:

Le modèle génère des suggestions d'optimisation en fonction des données historiques de l'équipement (par exemple, ajuster la vitesse de vis de 2,5%).

Vérification du jumeau numérique:

Validation de simulation des paramètres sur la plate-forme Edgex Foundry.

Effet de mise en œuvre

L'usine chimique de BASF a adopté ce schéma, réalisant une réduction de 17% de la consommation d'énergie et une augmentation de 9% du taux de qualité des produits.

3

Edge AI et l'avenir des affaires: Openai O1 contre Deepseek R1 pour les soins de santé, l'automobile et l'IIOT

Récupération instantanée de la base de connaissances

Conception d'architecture

Base de données vectorielle locale:

Utilisez ChromAdB pour stocker les manuels d'équipement et les spécifications de traitement (dimension d'intégration 768).

Récupération hybride:

Combinez l'algorithme BM25 + similitude cosinus pour la requête.

Génération de résultats:

Le modèle R1-7B résume et affine les résultats de récupération.

Cas typique

Les ingénieurs de Siemens ont résolu les défaillances de l'onduleur par le biais de requêtes en langage naturel, réduisant le temps de traitement moyen de 58%.

Défis et solutions de déploiement

Limitations de la mémoire:

Utilisé la technologie de quantification du cache KV, réduisant l'utilisation de la mémoire du modèle 14B de 32 Go à 9 Go.

Assurer les performances en temps réel:

La latence d'inférence unique stabilisée à ± 15 ms grâce à l'optimisation du graphique CUDA.

Drift du modèle:

Mises à jour incrémentielles hebdomadaires (transmettant seulement 2% des paramètres).

Environnements extrêmes:

Conçu pour des plages de température larges de -40 ° C à 85 ° C avec un niveau de protection IP67.

5
微信图片 _20240614024031.jpg1

Conclusion

Les coûts de déploiement actuels sont désormais réduits à 599 $ / nœud (Jetson Orin NX), avec des applications évolutives se formant dans des secteurs tels que la fabrication 3C, l'assemblage automobile et la chimie énergétique. L'optimisation continue de l'architecture et de la technologie de quantification du MOE devrait permettre au modèle 70b de fonctionner sur les périphériques de bord d'ici la fin de 2025.

Trouver la solution de câble ELV

Câbles de contrôle

Pour BMS, bus, industriel, câble d'instrumentation.

Système de câblage structuré

Réseau et données, câble à fibre optique, cordon de patch, modules, plaque de face

2024 expositions et événements Revue

16 avril-18e, 2024 Moyen-Orient à Dubaï

16 avril au 18, 2024 Securika à Moscou

9 mai 2024 Nouveaux produits et technologies Lance Event à Shanghai

22 octobre au 25 octobre, 2024 Sécurité Chine à Pékin

19-20 novembre 2024 Connected World KSA


Heure du poste: février-07-2025