NVIDIA DGX Spark – Siêu máy tính AI mọi lúc mọi nơi

Ngày 22/04/2026

Giới thiệu

Đưa quá trình phát triển AI của bạn từ trung tâm dữ liệu đến bàn làm việc với NVIDIA DGX Spark™. NVIDIA DGX Spark cung cấp tính năng của hệ điều hành DGX cùng với hiệu năng của siêu chip NVIDIA Grace Blackwell GB10 cho các nhà phát triển và kỹ sư ở bên ngoài trung tâm dữ liệu.

Thay vì dựa vào điện toán đám mây, mượn tài nguyên từ hạ tầng điện toán của bạn hoặc dựa vào máy trạm truyền thống, NVIDIA DGX Spark cung cấp 128GB bộ nhớ và hiệu năng AI 1 petaFLOP trong một thiết bị nhỏ gọn với kích thước chỉ 15 x 15cm.

Bạn có thể khai thác khả năng phát triển AI cấp độ doanh nghiệp trong một thiết bị nhỏ gọn và triển khai NVIDIA DGX Spark trong team của bạn để đạt được mật độ hiệu năng vượt trội. Hãy cùng xem những gì DGX Spark có thể hỗ trợ trong quy trình phát triển AI của bạn.

Mang theo nó mọi lúc mọi nơi

NVIDIA DGX Spark là một nền tảng phát triển trí tuệ nhân tạo (AI) với chip xử lý NVIDIA GB10 Grace Blackwell Superchip làm trung tâm, sở hữu hiệu năng AI 1 petaFLOP, được cài đặt sẵn bộ phần mềm AI của NVIDIA và bộ nhớ hợp nhất (Unified Memory) 128GB. Tất cả được gói gọn trong một máy tính mini di động với phong cách thiết kế của máy chủ DGX. DGX Spark lý tưởng cho:

  • Tinh chỉnh và triển khai AI quy mô nhỏ: Tinh chỉnh và vận hành các mô hình LLM cục bộ và AI tạo sinh.
  • Xây dựng AI prototype: Khám phá các kiến ​​trúc AI khác nhau trên một thiết bị trừu tượng được kết nối trực tiếp về trung tâm dữ liệu của bạn.
  • Truyền thông & Sáng tạo: Tạo video bằng AI cục bộ, Stable Diffusion và quy trình sản xuất có sự hỗ trợ của AI
  • Giáo dục & Nghiên cứu: Các trường đại học có thể sử dụng DGX Spark cho nghiên cứu chương trình giảng dạy về AI thực tiễn.

NVIDIA DGX Spark là một máy trạm AI siêu di động, cho phép bạn mang theo mọi nơi. DGX Spark vừa vặn trong ba lô của bạn, vì vậy nhóm của bạn có thể mang sức mạnh tính toán đến các studio, trung tâm dữ liệu và phòng thí nghiệm. Tính linh hoạt trong triển khai và khả năng mở rộng lên cơ sở hạ tầng điện toán doanh nghiệp là điểm mạnh của DGX Spark. Đó là tất cả những gì NVIDIA hình dung cho trung tâm dữ liệu, được gói gọn trong một siêu máy tính để bàn nhỏ gọn kích thước 15 x 15 x 5cm.

Để tôn vinh sức mạnh hiệu năng của mình, NVIDIA DGX Spark sở hữu khung máy hoàn toàn bằng vàng với lưới tản nhiệt ở mặt trước và mặt sau, được mô phỏng theo NVIDIA DGX-1 nguyên bản ra mắt năm 2016.

  • Siêu chip NVIDIA GB10 Grace Blackwell: Hiệu năng AI lên đến 1 petaFLOP ở độ chính xác FP4 và 31 TFLOPS ở độ chính xác FP32.
  • Bộ nhớ CPU-GPU hợp nhất 128GB: Bộ nhớ hợp nhất loại bỏ nút thắt cổ chai trong việc truyền dữ liệu giữa CPU và GPU, cho phép các nhà phát triển tạo mẫu, tinh chỉnh và chạy suy luận cục bộ một cách tối ưu.
  • Công nghệ mạng NVIDIA ConnectX cho phép tạo cụm máy chủ và NVIDIA NVLink-C2C cho băng thông PCIe gấp 5 lần. Các nhà phát triển có thể kết nối thêm một thiết bị NVIDIA DGX Spark thứ hai để tăng hiệu năng tính toán và bộ nhớ, hỗ trợ các mô hình AI lớn hơn.

Thông số kỹ thuật NVIDIA DGX Spark

NVIDIA DGX Spark
NVIDIA Grace CPU 20 ARM Cores
(10 Cortex®-X925 + 10 Cortex-A725)
CPU Memory 128GB Unified LPDDR5X
at 273 GB/s
NVIDIA GPU NVIDIA Blackwell
Networking 1x 10Gb Ethernet
Networking NIC NVIDIA ConnectX-7 NIC
(at 200Gb Ethernet
Net. Bandwidth Up to 200Gb/s
Storage Up to 4TB NVMe SSD
Connectivity WiFi 7 & Bluetooth 5.3
Output 1x HDMI 2.1a

 

Hiệu năng AI của NVIDIA DGX Spark

Thay vì dựa vào điện toán đám mây và các lệnh gọi API, DGX Spark thể hiện hiệu năng mạnh mẽ trong các tác vụ tinh chỉnh, tạo ảnh, khoa học dữ liệu và suy luận. NVIDIA đã công bố thông lượng trên các tác vụ AI với NVIDIA DGX Spark.

NVIDIA DGX Spark dành cho suy luận LLM cục bộ

DGX Spark mang lại tốc độ tạo token ấn tượng trên nhiều mô hình khác nhau. Các GPU máy trạm cao cấp hiện nay—NVIDIA RTX PRO™ 6000 Blackwell—có 96GB VRAM, trong khi DGX Spark cung cấp nhiều hơn với 128GB bộ nhớ hợp nhất. Điều này cho phép bạn chạy các mô hình lớn hơn ngay tại chỗ, ngay cả khi hiệu năng thấp hơn một chút so với RTX PRO 6000 Blackwell. Theo đánh giá chuyên môn của chúng tôi, tốc độ trên 20 token mỗi giây là hoàn toàn có thể sử dụng được.

Model Precision Backend Prompt processing throughput(tokens/sec) Token generation throughput(tokens/sec)
Qwen3 14B NVFP4 TRT-LLM 5928.95 22.71
GPT-OSS-20B MXFP4 llama.cpp 3670.42 82.74
GPT-OSS-120B MXFP4 llama.cpp 1725.47 55.37
Llama 3.1 8B NVFP4 TRT-LLM 10256.9 38.65
Qwen2.5-VL-7B-Instruct NVFP4 TRT-LLM 65831.77 41.71
Qwen3 235B(on dual DGX Spark) NVFP4 TRT-LLM 23477.03 11.73

 

Fine-tuning với NVIDIA DGX Spark

Với tính di động của DGX Spark, các nhà phát triển có thể tận dụng sức mạnh tính toán trong một máy trạm di động nhỏ gọn để tinh chỉnh và thử nghiệm trước khi đưa vào sản xuất. DGX Spark đưa các mô hình AI tùy chỉnh đến tay mọi người, từ những người đam mê đến các nhà phát triển và doanh nghiệp.

Model Method Backend Configuration Peak tokens/sec
Llama 3.2 3B Full fine-tuning PyTorch Sequence length: 2048
Batch size: 8
Epoch: 1
Steps: 125
BF16
82,739.20
Llama 3.1 8B LoRA PyTorch Sequence length: 2048
Batch size: 4
Epoch: 1
Steps: 125
BF16
53,657.60
Llama 3.3 70B QLoRA PyTorch Sequence length: 2048
Batch size: 8
Epoch: 1
Steps: 125
FP4
5,079.04

 

Image Generation với NVIDIA DGX Spark

Với bộ nhớ hợp nhất 128GB và khả năng tính toán lên đến 1 petaFLOP, DGX Spark hỗ trợ quy trình xử lý hình ảnh độ phân giải cao và các mô hình tạo sinh phức tạp. Các nhà phát triển có thể tận dụng độ chính xác FP4 để đạt tốc độ lặp nhanh hoặc duy trì độ trung thực khi chất lượng là yếu tố quan trọng.

Model Precision Backend Configuration Images/min
Flux.1 12B Schnell FP4 TensorRT Resolution: 1024×1024
Denoising steps: 4
Batch size: 1
23
SDXL1.0 BF16 TensorRT Resolution: 1024×1024
Denoising steps: 50
Batch size: 2
7

 


 

Câu hỏi thường gặp về NVIDIA DGX Spark

 

Điều gì làm cho NVIDIA DGX Spark khác biệt so với các hệ thống phát triển AI khác?

DGX Spark mang kiến ​​trúc DGX cấp doanh nghiệp của NVIDIA vào một thiết kế nhỏ gọn, tách biệt khỏi các tài nguyên tính toán chính. Với hiệu năng AI lên đến 1 petaFLOP và bộ nhớ 128GB, các nhà phát triển và nghiên cứu AI về cơ bản có một trung tâm dữ liệu di động nằm gọn trong ba lô, cho phép họ tạo mẫu, tinh chỉnh và triển khai các mô hình AI ở bất cứ đâu.

NVIDIA DGX Spark được thiết kế dành cho đối tượng nào?

DGX Spark được xây dựng dành cho các nhà phát triển, kỹ sư, nhà nghiên cứu và những người đam mê AI muốn có khả năng tính toán hiệu năng cao tại chỗ để phát triển/tạo mẫu AI, tinh chỉnh và suy luận cục bộ . DGX Spark sử dụng cùng một hệ thống backend tương tự với phần cứng NVIDIA cấp doanh nghiệp, vì vậy bạn có thể chuyển các mô hình của mình trực tiếp lên trung tâm dữ liệu hoặc đám mây một cách mượt mà.

NVIDIA DGX Spark sử dụng hệ điều hành nào?

DGX Spark chạy hệ điều hành DGX OS , cùng môi trường được sử dụng trong các hệ thống trung tâm dữ liệu của NVIDIA. Nó cũng được cài đặt sẵn toàn bộ bộ phần mềm AI của NVIDIA, bao gồm CUDA, cuDNN, TensorRT và các container Docker được cấu hình sẵn, hoàn toàn tương thích với các framework phổ biến như PyTorch, TensorFlow và JAX .

Tôi có thể ghép nhiều thiết bị NVIDIA DGX Spark lại với nhau thành một nhóm được không?

Được. Với hỗ trợ kết nối mạng ConnectX-7 tích hợp sẵn (200 Gbps), bạn có thể kết nối nhiều thiết bị DGX Spark để tăng dung lượng bộ nhớ, xử lý song song, huấn luyện mô hình phân tán và nhiều hơn nữa.

Tôi có thể mua thiết bị NVIDIA DGX Spark ở đâu?

DGX Spark được cung cấp bởi Nhất Tiến Chung thông qua các sản phẩm OEM như ASUS Ascent GX10MSI EdgeXpert MS-C931 (hoàn toàn tương đương với NVIDIA DGX Spark Founder’s Edition, chỉ khác về thiết kế và chính sách hỗ trợ theo từng hãng).

Phần kết luận

NVIDIA DGX Spark thay đổi cách các chuyên gia AI tiếp cận sức mạnh tính toán cấp doanh nghiệp, cung cấp khả năng tương đương trung tâm dữ liệu trong một máy trạm mini nhỏ gọn. Mang sức mạnh đến với các kỹ sư và nhà sáng tạo của bạn để tăng cường nền tảng AI, chạy suy luận LLM cá nhân và tạo mẫu các giải pháp AI mới mà không bị hạn chế về hạ tầng điện toán.

Kết hợp kiến ​​trúc Grace Blackwell tiên tiến với khả năng tích hợp phần mềm liền mạch và các tùy chọn kết nối mở rộng, DGX Spark được thiết kế dành riêng cho những người mong muốn tính di động, hiệu năng và khả năng tương thích với hệ sinh thái AI của NVIDIA.

Đặt mua NVIDIA DGX Spark thông qua NTC, đối tác NPN cấp độ Elite của NVIDIA. Khai thác hiệu năng và tính linh hoạt chưa từng có cho dự án đột phá tiếp theo của bạn.

Tăng tốc quá trình huấn luyện AI trên NVIDIA DGX Spark

Mang sức mạnh tính toán AI doanh nghiệp đi bất cứ đâu. NVIDIA DGX Spark cung cấp hiệu năng lên đến 1 petaFLOP trong một thiết kế nhỏ gọn 15 x 15 x 5cm. Khai thác sức mạnh trung tâm dữ liệu trong ba lô của bạn. Hiện đã có sẵn thông qua Nhất Tiến Chung.

Nhận báo giá ngay hôm nay!