Năm 2025 đã đánh dấu một bước ngoặt lớn cho sự phát triển của AI trên máy tính cá nhân (PC), khi các mô hình ngôn ngữ nhỏ (SLM) cải thiện độ chính xác gần gấp đôi và các công cụ như Ollama hay ComfyUI tăng trưởng người dùng gấp mười lần. Tiếp nối đà phát triển đó, tại triển lãm CES tuần này, NVIDIA đã công bố làn sóng nâng cấp AI mới cho các thiết bị GeForce RTX và NVIDIA RTX PRO, mang đến hiệu suất và bộ nhớ cần thiết để triển khai AI tạo sinh ngay trên máy tính của người dùng.
Đột phá trong tạo sinh Video 4K với LTX-2 và ComfyUI
Điểm nhấn quan trọng nhất là quy trình tạo video AI được hỗ trợ bởi RTX, giúp các nghệ sĩ kiểm soát chính xác tác phẩm trong khi tốc độ tạo video nhanh hơn gấp 3 lần và giảm tới 60% lượng VRAM tiêu thụ. Quy trình này cho phép người dùng thiết lập bối cảnh 3D trong Blender, tạo ra các khung hình chính (keyframe) chân thực và sau đó chuyển đổi chúng thành video 4K chất lượng cao nhờ công nghệ NVIDIA RTX Video.
Sức mạnh này đến từ việc phát hành mô hình LTX-2 mới của Lightricks, cho phép tạo ra các video 4K dài tới 20 giây với độ trung thực ấn tượng và âm thanh tích hợp. NVIDIA đã hợp tác chặt chẽ với ComfyUI để tối ưu hóa hiệu suất, hỗ trợ định dạng dữ liệu NVFP4 và NVFP8. Cụ thể, khi sử dụng định dạng NVFP4 trên dòng card đồ họa RTX 50 Series, hiệu suất tăng gấp 3 lần và VRAM giảm 60%; còn với NVFP8, hiệu suất tăng gấp đôi và VRAM giảm 40%.
Tìm kiếm thông minh và Tăng tốc mô hình ngôn ngữ
Không chỉ dừng lại ở hình ảnh, NVIDIA còn giới thiệu bản cập nhật cho Hyperlink của Nexa.ai, biến PC RTX thành một kho kiến thức có thể tìm kiếm được. Tính năng mới cho phép tìm kiếm nội dung trong video (như vật thể, hành động, lời nói) với tốc độ xử lý cực nhanh: chỉ mất 30 giây để lập chỉ mục 1GB dữ liệu trên GPU RTX 5090, so với 1 giờ nếu chạy trên CPU.
Ngoài ra, NVIDIA cũng đã hợp tác với cộng đồng mã nguồn mở để tăng tốc độ suy luận cho các mô hình ngôn ngữ nhỏ (SLM). Hiệu suất của llama.cpp và Ollama đã được cải thiện lần lượt 35% và 30%, mang lại lợi ích lớn cho các ứng dụng như LM Studio hay MSI AI Robot.
Nâng cấp NVIDIA Broadcast và DGX Spark
Ứng dụng NVIDIA Broadcast phiên bản 2.1 cũng được cập nhật tính năng Virtual Key Light (Đèn chính ảo), hiện hỗ trợ các GPU máy tính bàn từ RTX 3060 trở lên, giúp cải thiện ánh sáng cho livestream và hội họp. Cuối cùng, siêu máy tính để bàn DGX Spark nhận được bản cập nhật hiệu suất giúp chạy nhanh hơn tới 2,6 lần so với thời điểm ra mắt cách đây ba tháng, hỗ trợ đắc lực cho việc tinh chỉnh mô hình và thử nghiệm AI cục bộ.
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Cô Cindy Lê hiện đảm nhiệm vai trò Giám đốc Phát triển Chiến lược Quốc tế tại Công ty Luật Nguyễn, một vị trí mang tính then chốt trong việc dẫn dắt các doanh nghiệp Việt Nam mở rộng quy mô và vị thế trên thị trường toàn cầu. Với tư duy chiến lược sắc sảo, kinh nghiệm thực chiến đa ngành, và khả...
"Bẫy" Nợ Thuế Từ Những Mã Số Thuế Kinh Doanh "Bỏ Quên"
Siết chặt quản lý đo lường, chất lượng xăng dầu theo quy định mới
Luật Hoạt động giám sát của Quốc hội và Hội đồng nhân dân: Điểm mới
Không được tự ý gộp Báo cáo tài chính: Lưu ý quan trọng từ Bộ Tài chính
Cảnh báo: Doanh nghiệp có thể bị phạt tới 70 triệu đồng nếu xuất hóa đơn quà tặng Tết sai thời điểm
Khởi tố Đoàn Văn Sáng vì tội giết người ở Lạng Sơn
Luật Thuế GTGT 1/1/2026: Bước Ngoặt Cho Hộ Kinh Doanh Và Nông Nghiệp
Luật Thuế TNCN 2025: Chính Thức Áp Dụng Biểu Thuế 5 Bậc Mới
Quy định mới: Tiền lương từ 5 triệu đồng phải chuyển khoản
Foreigners Seeking a Vietnamese Driver’s License: What You Must Meet