Razer hat den Blade 18 (2026) mit Intel Core Ultra 9 290HX Plus, GPU bis zu RTX 5090 und Dual-Mode-Display vorgestellt. Das Gerät ist auf KI-Berechnungen und lokale LLM-Ausführung ausgerichtet.
Im Kern des Razer Blade 18 arbeitet der Intel Core Ultra 9 290HX Plus Prozessor mit 24 Kernen und einer Taktfrequenz von 5,5 GHz. Das integrierte NPU-Modul Intel AI Boost bietet eine Leistung von 13 TOPS für die Hardware-Beschleunigung von Inferenzoperationen maschineller Lernmodelle. Die maximale Konfiguration ist mit einer diskreten NVIDIA GeForce RTX 5090 Laptop GPU mit einem TGP von 175 W und 24 GB Videospeicher ausgestattet.
Das Gerät zeigt eine Steigerung der LLM-Verarbeitungsgeschwindigkeit um bis zu 37% im Vergleich zu früheren Generationen. Bei Nutzung der Plattform LM Studio generiert das System bis zu 162 Tokens pro Sekunde, was die Iterationszeit bei der lokalen Bereitstellung großer Sprachmodelle reduziert und die Feedbackschleifen im Entwicklungsprozess beschleunigt.
Der Laptop ist mit einem 18-Zoll-Dual-Mode-Display ausgestattet, das zwischen UHD+ (3840×2400, 240 Hz) für Grafikarbeiten und FHD+ (1920×1200, 440 Hz) für E-Sports-Disziplinen umschalten kann. Der Hersteller gibt 100% Abdeckung des DCI-P3-Farbraums und eine erhöhte Panelhelligkeit an.
Das Kühlsystem basiert auf einer Dampfkammer und einer Mehrkreislüfterkonfiguration. Dies ermöglicht die Aufrechterhaltung einer stabilen CPU- und GPU-Taktfrequenz bei langen Renderingsitzungen, KI-Inferenz oder Spielbelastung.
Die Anschlüsse umfassen Thunderbolt 5, HDMI 2.1, Wi-Fi 7, Ethernet 2,5 Gb, UHS-II-Kartenleser. Das Laden über USB-C unterstützt bis zu 100 W. Der 99-Wh-Akku ermöglicht schnelles Laden auf 50% in 30 Minuten. Das Gerätegewicht beträgt 3,2 kg, das mitgelieferte Netzteil ist für 400 W ausgelegt.
Der Intel Core Ultra 9 290HX Plus Prozessor tauscht über den PCIe 5.0-Bus Daten mit der NVIDIA RTX 5090 GPU aus, die Tensorbeschleunigung für LLMs durchführt. Die Intel AI Boost NPU entlastet die CPU bei Aufgaben, die geringe Latenz und niedrigen Stromverbrauch erfordern, und übergibt schwere Matrixoperationen an die CUDA-Kerne der Grafikkarte. Das Dual-Mode-Display wechselt über einen eingebetteten Controller die Modi durch Framebuffer-Skalierung und Änderung der Bildwiederholfrequenz, was mit den GPU-Treibern synchronisiert ist. Das Kühlsystem mit Dampfkammer leitet Wärmeströme von bis zu 250 W kombinierter TDP ab und verhindert so Throttling.
Die Verwendung einer dedizierten NPU mit 13 TOPS zusammen mit der diskreten RTX 5090 schafft eine heterogene Rechenarchitektur: Kleine KI-Aufgaben (Rauschunterdrückung, Gestenerkennung) werden auf der NPU mit minimalem Stromverbrauch gelöst, während die LLM-Inferenz auf den Tensorkernen der GPU über die DirectML- oder CUDA-API ausgeführt wird. Die Speicherbandbreite zwischen CPU und GPU (PCIe 5.0 x16) kann jedoch bei der Arbeit mit Modellen, die nicht vollständig in den 24 GB Videospeicher passen, zum Engpass werden und häufige Datenübertragungen über den DDR5-Systemarbeitsspeicher verursachen.