DeepSeek-R1 kombinující AI a Edge Computing pro průmyslovou internetu

Zavedení

Destilované modely malé velikosti DeepSeek-R1 jsou vyladěny pomocí řetězu promyšlených dat generovaných DeepSeek-R1, označené pomocí...Štítky, zdědění schopností uvažování R1. Tyto jemně vyladěné datové sady výslovně zahrnují procesy uvažování, jako je rozklad problému a střední odpočty. Využití zesílení sladilo vzorce chování destilovaného modelu s kroky uvažování generované R1. Tento destilační mechanismus umožňuje malým modelům udržovat výpočetní účinnost a získávat složité schopnosti uvažování poblíž schopností větších modelů, což má významnou aplikační hodnotu ve scénářích omezených na zdroje. Například verze 14B dosáhne 92% dokončení kódu původního modelu DeepSeek-R1. Tento článek představuje destilovaný model DeepSeek-R1 a jeho základní aplikace v průmyslovém výpočtu Edge, shrnutý v následujících čtyřech směrech, spolu se specifickými implementačními případy:

DC3C637C5Bead8B62ED51B6D83AC0B4

Prediktivní údržba zařízení

Technická implementace

Fúze senzoru:

Integrujte vibrace, teplotu a aktuální data z PLC prostřednictvím protokolu Modbus (vzorkovací frekvence 1 KHz).

Extrakce funkcí:

Spusťte Impuls na Jetson Orin NX pro extrahování 128-dimenzionálních funkcí časové řady.

Inference modelu:

Nasaďte model DeepSeek-R1-DISTILL-14B a zadávejte vektory funkcí pro generování hodnot pravděpodobnosti poruchy.

Dynamická nastavení:

Spuštění údržby nařízení o údržbě, když důvěra> 85%, a zahájit proces sekundárního ověření, když <60%.

Relevantní případ

Schneider Electric nasadil toto řešení na těžebních strojích a snížil falešné pozitivní sazby o 63% a náklady na údržbu o 41%.

1

Běh destilovaného modelu DeepSeek R1 na Insand AI Edge Počítače

Vylepšená vizuální kontrola

Výstupní architektura

Typické potrubí nasazení:

Camera = gige_vision_camera (500fps) # gigabitová průmyslová kamera
frame = Camera.Capture () # zachytit obrázek
předběžné zpracování = opencv.denoise (frame) # denoising preprocesing
defect_type = deepseek_r1_7b.infer (předběžné zpracování) # Klasifikace defektů
pokud defect_type! = 'normal':
Plc.trigger_reject () # mechanismus spouštěcího třídění

Metriky výkonu

Zpoždění zpracování:

82 ms (Jetson Agx Orin)

Přesnost:

Injekční detekce defektů dosahuje 98,7%.

2

Důsledky Deepseek R1: Vítězové a poražení v generativním hodnotovém řetězci AI

Optimalizace procesního toku

Klíčové technologie

Interakce přirozeného jazyka:

Operátoři popisují anomálie vybavení hlasem (např. „Kolísání tlaku extrudéru ± 0,3 MPa“).

Multimodální uvažování:

Model generuje návrhy optimalizace založené na historických datech zařízení (např. Nastavení rychlosti šroubu o 2,5%).

Digitální ověření dvojčat:

Ověření simulace parametrů na platformě Edgex Foundry.

Implementační účinek

Chemická rostlina BASF přijala toto schéma, dosahovala 17% snížení spotřeby energie a 9% zvýšení míry kvality produktu.

3

Edge AI a budoucnost podnikání: OpenAI O1 vs. Deepseek R1 pro zdravotnictví, automobilový průmysl a IIOT

Okamžité vyhledávání znalostní základny

Návrh architektury

Lokální vektorová databáze:

Použijte Chromadb k ukládání příruček zařízení a specifikace procesů (vložení dimenze 768).

Hybridní vyhledávání:

Kombinujte algoritmus BM25 + podobnost kosinu pro dotaz.

Generování výsledků:

Model R1-7B shrnuje a zdokonaluje výsledky vyhledávání.

Typický případ

Inženýři Siemens vyřešili selhání střídače prostřednictvím dotazů přirozeného jazyka, čímž se snížila průměrná doba zpracování o 58%.

Výzvy a řešení nasazení

Omezení paměti:

Využila technologie kvantizace mezipaměti KV, snižovala využití paměti modelu 14B z 32 GB na 9 GB.

Zajištění výkonu v reálném čase:

Stabilizovala latence s jedním inferencem na ± 15 ms pomocí optimalizace grafu CUDA.

Model Drift:

Týdenní přírůstkové aktualizace (přenos pouze 2% parametrů).

Extrémní prostředí:

Navrženo pro široké teplotní rozsahy -40 ° C až 85 ° C s úrovní ochrany IP67.

5
微信图片 _20240614024031.jpg1

Závěr

Aktuální náklady na nasazení se nyní snížily na 599 $/uzel (Jetson Orin NX), přičemž škálovatelné aplikace vytvářely v sektorech, jako je výroba 3C, automobilová montáž a chemie energie. Očekává se, že nepřetržitá optimalizace architektury MOE a kvantizace technologie umožní do konce roku 2025 model 70B na okraji.

Najděte řešení kabelu ELV

Ovládací kabely

Pro BMS, Bus, Industrial, Instrumentation Cable.

Strukturovaný systém kabeláže

Síť a data, optický kabel, náplast, moduly, čelní deska

2024 Recenze výstav a událostí

16. dubna-18. 18. 2024 Střední východní energie v Dubaji

16. 18. 18. 18. 2024 Securika v Moskvě

9. května, 2024 Událost nových produktů a technologií v Šanghaji

22. října-25. 20. 2024 Zabezpečení Číny v Pekingu

19.-20. listopadu 2024 Connected World KSA


Čas příspěvku: únor-07-2025