DeepSeek-R1 kombinuje umělou inteligenci a edge computing pro průmyslový internet věcí (IoT).

Zavedení

Malé destilované modely DeepSeek-R1 jsou jemně doladěny pomocí myšlenkových dat generovaných DeepSeek-R1, označených...tagy, které dědí schopnosti uvažování od R1. Tyto vyladěné datové sady explicitně zahrnují procesy uvažování, jako je dekompozice problému a mezilehlé dedukce. Posilovací učení sladilo vzorce chování destilovaného modelu s kroky uvažování generovanými R1. Tento mechanismus destilace umožňuje malým modelům udržet si výpočetní efektivitu a zároveň získat schopnosti komplexního uvažování blízké schopnostem větších modelů, což má významnou aplikační hodnotu v situacích s omezenými zdroji. Například verze 14B dosahuje 92 % dokončení kódu původního modelu DeepSeek-R1. Tento článek představuje destilovaný model DeepSeek-R1 a jeho klíčové aplikace v průmyslovém edge computingu, shrnuté v následujících čtyřech směrech, spolu s konkrétními implementačními případy:

dc3c637c5bead8b62ed51b6d83ac0b4

Prediktivní údržba zařízení

Technická implementace

Fúze senzorů:

Integrace dat o vibracích, teplotě a proudu z PLC prostřednictvím protokolu Modbus (vzorkovací frekvence 1 kHz).

Extrakce prvků:

Spusťte Edge Impulse na Jetson Orin NX pro extrakci 128-rozměrných časových řad.

Inference modelu:

Nasaďte model DeepSeek-R1-Distill-14B a zadejte vektory rysů pro generování hodnot pravděpodobnosti poruch.

Dynamické nastavení:

Spustit pracovní příkazy údržby, když je spolehlivost > 85 %, a zahájit proces sekundárního ověření, když je < 60 %.

Relevantní případ

Společnost Schneider Electric nasadila toto řešení v těžebních strojích, čímž snížila míru falešně pozitivních výsledků o 63 % a náklady na údržbu o 41 %.

1

Spuštění destilovaného modelu DeepSeek R1 na edge počítačích InHand s umělou inteligencí

Vylepšená vizuální kontrola

Architektura výstupu

Typický postup nasazení:

kamera = GigE_Vision_Camera(500fps) # Gigabitová průmyslová kamera
frame = camera.capture() # Zachycení obrázku
preprocessed = OpenCV.denoise(frame) # Předzpracování odšumování
defect_type = DeepSeek_R1_7B.infer(předzpracované) # Klasifikace defektu
pokud typ_defektu != 'normální':
PLC.trigger_reject() # Mechanismus třídění spouštěčů

Metriky výkonu

Zpoždění zpracování:

82 ms (Jetson AGX Orin)

Přesnost:

Detekce vad vstřikovaných forem dosahuje 98,7 %.

2

Důsledky DeepSeek R1: Vítězové a poražení v hodnotovém řetězci generativní umělé inteligence

Optimalizace toku procesů

Klíčové technologie

Interakce s přirozeným jazykem:

Operátoři popisují anomálie zařízení hlasem (např. „Kolísání tlaku extruderu ±0,3 MPa“).

Multimodální uvažování:

Model generuje optimalizační návrhy na základě historických dat zařízení (např. úprava otáček šroubu o 2,5 %).

Ověření digitálního dvojčete:

Validace simulace parametrů na platformě EdgeX Foundry.

Implementační efekt

Chemický závod společnosti BASF tento systém přijal a dosáhl 17% snížení spotřeby energie a 9% zvýšení kvality výrobků.

3

Edge AI a budoucnost podnikání: OpenAI o1 vs. DeepSeek R1 pro zdravotnictví, automobilový průmysl a IIoT

Okamžité načtení znalostní báze

Architektonický návrh

Lokální vektorová databáze:

Použijte ChromaDB k ukládání manuálů k zařízením a procesních specifikací (vložená dimenze 768).

Hybridní vyhledávání:

Kombinace algoritmu BM25 a kosinové podobnosti pro dotaz.

Generování výsledků:

Model R1-7B shrnuje a zpřesňuje výsledky vyhledávání.

Typický případ

Inženýři společnosti Siemens řešili poruchy střídačů pomocí dotazů v přirozeném jazyce, čímž zkrátili průměrnou dobu zpracování o 58 %.

Problémy s nasazením a jejich řešení

Omezení paměti:

Využívá technologii kvantizace KV Cache, čímž se snižuje využití paměti u 14B modelu z 32 GB na 9 GB.

Zajištění výkonu v reálném čase:

Stabilizovaná latence jediné inference na ±15 ms díky optimalizaci CUDA Graph.

Drift modelu:

Týdenní přírůstkové aktualizace (přenos pouze 2 % parametrů).

Extrémní prostředí:

Navrženo pro široký teplotní rozsah od -40 °C do 85 °C s krytím IP67.

5
微信图片_20240614024031.jpg1

Závěr

Současné náklady na nasazení se nyní snížily na 599 USD/uzel (Jetson Orin NX), přičemž škálovatelné aplikace se formují v odvětvích, jako je výroba 3C, montáž automobilů a energetická chemie. Očekává se, že neustálá optimalizace architektury MoE a kvantizační technologie umožní modelu 70B běžet na edge zařízeních do konce roku 2025.

Najděte řešení kabelů ELV

Ovládací kabely

Pro kabely BMS, sběrnice, průmyslové a přístrojové kabely.

Strukturovaný kabelážní systém

Síť a data, optický kabel, propojovací kabel, moduly, čelní panel

Přehled výstav a akcí 2024

16.–18. dubna 2024, veletrh energetiky na Středním východě v Dubaji

16.–18. dubna 2024 Securika v Moskvě

9. května 2024 AKCE K UVÁDĚNÍ NOVÝCH PRODUKTŮ A TECHNOLOGIÍ v Šanghaji

22.–25. října 2024 SECURITY CHINA v Pekingu

19.–20. listopadu 2024 CONNECTED WORLD KSA


Čas zveřejnění: 7. února 2025