header banner

Cuộc chiến AI: Baidu ra mắt AI mới, rẻ hơn DeepSeek trên 60%

Thứ sáu - 02/05/2025 12:28
Cuộc đua AI với tối ưu công suất sẽ dẫn đến một hệ sinh thái AI đa dạng hơn, nơi các mô hình giá rẻ và hiệu quả chiếm ưu thế ở các thị trường đang phát triển, trong khi các mô hình mạnh mẽ tiếp tục thống trị các ứng dụng đòi hỏi tính toán cao.
Ai nghe sao cho dung
Ai nghe sao cho dung

Baidu ra mắt hai mô hình AI mới, rẻ hơn DeepSeek hơn 60%

Vào ngày 16/3/2025, Baidu công bố hai mô hình AI mới: Ernie 4.5 (mô hình nền tảng đa phương thức) và Ernie X1 (mô hình suy luận đa phương thức đầu tiên). Baidu tuyên bố Ernie X1 có hiệu suất ngang DeepSeek R1 nhưng giá chỉ bằng một nửa, và Ernie 4.5 vượt qua DeepSeek V3 và OpenAI GPT-4o trên một số bài kiểm tra như CCBench và OCRBench. Đến 25/4/2025, Baidu ra mắt Ernie 4.5 Turbo, với chi phí rẻ hơn hơn 60% so với DeepSeek, cụ thể giá API là 2 nhân dân tệ (0.28 USD) cho mỗi triệu token đầu vào và 8 nhân dân tệ cho mỗi triệu token đầu ra, so với 0.55 USD và 2.19 USD của DeepSeek R1. Các mô hình này miễn phí cho người dùng cá nhân, và Baidu có kế hoạch mở mã nguồn Ernie 4.5 vào cuối tháng 6/2025, cho thấy chiến lược cạnh tranh dựa trên chi phí thấp và tiếp cận rộng rãi.


Cuộc đua AI với định hướng tiết kiệm năng lượng và tối ưu công suất sẽ đi đến đâu?

Cuộc đua AI toàn cầu đang chuyển hướng từ việc tăng quy mô phần cứng sang tối ưu hóa hiệu suất, tiết kiệm năng lượng, và giảm chi phí. Sự nổi lên của Baidu và DeepSeek tại Trung Quốc là minh chứng cho xu hướng này. Dưới đây là triển vọng và định hướng tương lai:

  1. Tối ưu hóa tài nguyên:
    • Các công ty Trung Quốc như Baidu và DeepSeek sử dụng các kỹ thuật như mixture-of-experts (MoE), tính toán độ chính xác thấp (FP8), và tối ưu hóa giao tiếp GPU để giảm phụ thuộc vào chip cao cấp. Ví dụ, DeepSeek huấn luyện DeepSeek V3 (671 tỷ tham số) với chỉ 2.048 GPU Nvidia H800, trong khi Baidu giảm 90% chi phí suy luận trong 12 tháng.
    • Xu hướng này sẽ thúc đẩy việc phát triển các mô hình nhẹ hơn, hiệu quả hơn, phù hợp với các thiết bị như điện thoại thông minh và PC, mở rộng ứng dụng AI vào các ngành như ô tô, thương mại điện tử, và y tế.
  2. Mô hình mở mã nguồn (open-source):
    • DeepSeek khởi xướng làn sóng open-source tại Trung Quốc, với các mô hình như V2 và R1 được cung cấp miễn phí hoặc giá API thấp (0.14-0.28 USD mỗi triệu token). Điều này buộc Baidu, Alibaba, và Tencent phải mở mã nguồn để cạnh tranh.
    • Open-source giúp thu hút cộng đồng phát triển toàn cầu, giảm chi phí cho doanh nghiệp nhỏ, và tăng tốc độ áp dụng AI. Tuy nhiên, nó làm giảm doanh thu từ bán quyền truy cập mô hình, buộc các công ty chuyển sang kiếm tiền từ ứng dụng thực tế hoặc dịch vụ đám mây.
  3. Tiết kiệm năng lượng và bền vững:
    • AI tiêu tốn năng lượng lớn, đặc biệt trong huấn luyện. DeepSeek sử dụng MoE (chỉ kích hoạt 37 tỷ trong số 671 tỷ tham số) để giảm tiêu thụ năng lượng, và Baidu nhấn mạnh hiệu quả năng lượng trong Ernie 4.5 Turbo.
    • Trong tương lai, các công ty sẽ đầu tư vào AI xanh, sử dụng năng lượng tái tạo và tối ưu hóa phần cứng để đáp ứng quy định môi trường toàn cầu, đặc biệt tại châu Âu và Mỹ.
  4. Tác động dài hạn:
    • Tiếp cận rộng hơn: Mô hình giá rẻ giúp AI thâm nhập vào các thị trường nhạy cảm về giá như Đông Nam Á, châu Phi, và Mỹ Latinh, thúc đẩy đổi mới toàn cầu.
    • Cạnh tranh giá cả: Giá thấp có thể gây áp lực lên các công ty như OpenAI, buộc họ giảm giá hoặc đổi mới nhanh hơn.
    • Chuyển hướng sang ứng dụng: Khi mô hình nền tảng trở nên rẻ, giá trị sẽ nằm ở các ứng dụng thực tế (chatbot doanh nghiệp, tự động hóa). Baidu đã tích hợp AI vào Wenku để tạo bài thuyết trình, và DeepSeek được sử dụng bởi Lenovo, Tencent, và các chính quyền địa phương.
    • Nguy cơ bong bóng đầu tư: Sự hào hứng quanh mô hình giá rẻ có thể làm giảm nhu cầu đầu tư vào hạ tầng AI (chip, trung tâm dữ liệu), ảnh hưởng đến các công ty như Nvidia.

Trung Quốc bị hạn chế chip: Tối ưu hiệu suất có lợi hay bất lợi?

Do lệnh cấm xuất khẩu chip tiên tiến của Mỹ (như Nvidia H100), Trung Quốc phải sử dụng chip yếu hơn (Nvidia H800, Huawei Ascend 910B) và tập trung vào tối ưu hóa phần mềm. Điều này mang lại cả lợi ích và bất lợi trong cuộc chiến AI:

Những lợi ích của áp lực chip

  1. Đổi mới dưới áp lực:
    • Hạn chế chip thúc đẩy sáng tạo. DeepSeek sử dụng H800 nhưng tạo ra mô hình cạnh tranh với GPT-4 nhờ các kỹ thuật như MoE, nén bộ nhớ, và lập trình PTX thay vì CUDA. Baidu cũng tối ưu hóa Ernie 4.5 Turbo để giảm chi phí suy luận.
    • Sự đổi mới này giúp Trung Quốc xây dựng các mô hình hiệu quả, phù hợp với nguồn lực hạn chế.
  2. Chi phí thấp, cạnh tranh cao:
    • Các mô hình như Ernie X1 và DeepSeek V3 có giá API thấp hơn nhiều so với OpenAI (0.28 USD so với 15 USD mỗi triệu token đầu vào). Điều này giúp Trung Quốc chiếm ưu thế ở các thị trường nhạy cảm về giá và thu hút người dùng toàn cầu.
    • DeepSeek chi 5.5 triệu USD để huấn luyện V3, so với hàng trăm triệu USD của các mô hình Mỹ, cho thấy hiệu quả tài chính vượt trội.
  3. Tự lực và hệ sinh thái nội địa:
    • Trung Quốc phát triển chip nội địa (Huawei Ascend, Hygon, EnFlame) và phần mềm thay thế như CANN của Huawei (tương đương CUDA). DeepSeek tận dụng kho 10.000 chip Nvidia A100 mua trước lệnh cấm, kết hợp với chip yếu hơn, tạo sự linh hoạt.
    • Sự hỗ trợ từ Tencent, Lenovo, và các chính quyền địa phương cho DeepSeek cho thấy hệ sinh thái AI nội địa đang mạnh lên.
  4. Lợi thế open-source:
    • Hạn chế phần cứng đẩy Trung Quốc tập trung vào open-source, thu hút cộng đồng phát triển toàn cầu. DeepSeek R1 được Marc Andreessen gọi là “món quà cho thế giới”, tăng sức ảnh hưởng quốc tế của Trung Quốc.
  5. Hiệu quả môi trường:
    • Tối ưu hóa hiệu suất giảm tiêu thụ năng lượng, phù hợp với xu hướng AI bền vững, giúp Trung Quốc đáp ứng các tiêu chuẩn môi trường quốc tế.

Và những bất lợi là gì?

  1. Hạn chế về phần cứng tiên tiến:
    • Chip H800 và Ascend 910B kém hơn Nvidia H100 về tốc độ và hiệu suất, khiến Trung Quốc khó cạnh tranh trong các mô hình yêu cầu tính toán lớn, như huấn luyện mô hình siêu lớn (trillion parameters).
    • Theo Li Guojie (Học viện Kỹ thuật Trung Quốc), hiệu quả phần mềm không thể thay thế hoàn toàn sức mạnh tính toán, đặc biệt trong suy luận (inference), nơi nhu cầu tính toán dự kiến chiếm 70% vào năm 2026.
  2. Khoảng cách dài hạn:
    • Lợi thế hiện tại của DeepSeek và Baidu dựa trên kho chip A100 tích trữ trước lệnh cấm. Khi Nvidia ra mắt kiến trúc Blackwell mới, khoảng cách phần cứng giữa Mỹ và Trung Quốc sẽ nới rộng, đặc biệt khi Trung Quốc không thể nâng cấp chip tiên tiến.
  3. Phụ thuộc vào hệ sinh thái Nvidia:
    • Dù Huawei phát triển CANN, hệ sinh thái CUDA của Nvidia vẫn chiếm ưu thế nhờ sự trưởng thành và cộng đồng phát triển lớn. DeepSeek phải lập trình PTX ở cấp thấp, tốn thời gian và công sức, trong khi các công ty Mỹ sử dụng CUDA dễ dàng hơn.
  4. Rủi ro địa chính trị:
    • Sự thành công của DeepSeek khiến Mỹ có thể siết chặt hơn các lệnh cấm, không chỉ với chip mà còn với phần mềm và dữ liệu. Các nước như Ý đã cấm DeepSeek vì lo ngại bảo mật dữ liệu, làm hạn chế khả năng mở rộng toàn cầu.
    • Nếu DeepSeek được xem là công cụ của chính phủ Trung Quốc, các thị trường phương Tây có thể áp đặt thêm rào cản.
  5. Cạnh tranh nội bộ khốc liệt:
    • Thị trường Trung Quốc với 1.4 tỷ dân thu hút cả công ty nội địa và quốc tế, dẫn đến cạnh tranh gay gắt. Baidu, Alibaba, Tencent, và ByteDance đều ra mắt mô hình mới để đối phó DeepSeek, làm phân tán nguồn lực và giảm lợi nhuận.

Cuộc đua AI với định hướng tiết kiệm năng lượng và tối ưu công suất sẽ dẫn đến một hệ sinh thái AI đa dạng hơn, nơi các mô hình giá rẻ và hiệu quả chiếm ưu thế ở các thị trường đang phát triển, trong khi các mô hình mạnh mẽ tiếp tục thống trị các ứng dụng đòi hỏi tính toán cao. Trung Quốc, với hạn chế về chip, đã biến thách thức thành cơ hội bằng cách tập trung vào tối ưu hóa phần mềm, open-source, và chi phí thấp, mang lại lợi thế cạnh tranh về giá và tiếp cận.

Lợi ích của hướng đi này bao gồm đổi mới sáng tạo, chi phí thấp, và khả năng tự lực, giúp Trung Quốc duy trì vị thế trong cuộc đua AI. Tuy nhiên, bất lợi nằm ở khoảng cách phần cứng ngày càng lớn, phụ thuộc vào hệ sinh thái Nvidia, và rủi ro địa chính trị. Để thành công dài hạn, Trung Quốc cần tiếp tục đầu tư vào chip nội địa, mở rộng hệ sinh thái phần mềm, và xây dựng lòng tin với thị trường quốc tế để vượt qua các rào cản.

Tác giả bài viết: BBT Vinastrategy.com tổng hợp

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Mã bảo mật   
Download tài liệu
Thống kê
  • Đang truy cập40
  • Hôm nay2,868
  • Tháng hiện tại50,884
  • Tổng lượt truy cập525,760
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây