You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
**Unser Near-Tier (2,4 Mrd/s) schlaegt eine RTX 3060 um 5-12x.** Unser Foveal-Tier (611M/s) ist auf RTX 3060 IVF-PQ Niveau — aber mit 0,4% Fehler statt PQs 5-10%, und bei 0 EUR Hardwarekosten. Nur eine H100 (30.000 EUR, 700W) kommt in unsere Naehe — und die braucht PCIe-Transfer + Kernel-Launch Overhead den wir nicht haben.
21
+
Ein 35-EUR Raspberry Pi 4 bei 5 Watt erreicht oder schlaegt eine 350-EUR RTX 3060 bei 170 Watt. Ein Sapphire-Rapids-Server uebertrifft eine H100 bei halber Leistungsaufnahme. Ein 15-EUR Pi Zero 2W bei 2 Watt schlaegt FAISS CPU Flat noch um 60%.
20
22
21
23
Der Trick: GPU muss FP32-multiplizieren, FP32-dividieren und ueber PCIe transferieren. Wir lesen einen u8 aus einer 64KB Tabelle die im L1-Cache liegt. Kein Transfer, kein Kernel-Launch, kein Fliesskomma.
0 commit comments