BEIJING - Perusahaan teknologi Tiongkok Alibaba pada hari Rabu merilis versi baru model kecerdasan buatan Qwen 2.5 yang diklaim melampaui DeepSeek-V3 yang sangat diakui.
Waktu peluncuran Qwen 2.5-Max yang tidak biasa, pada hari pertama Tahun Baru Imlek saat sebagian besar orang Tiongkok libur kerja dan berkumpul dengan keluarga, menunjukkan tekanan yang ditimbulkan oleh kenaikan pesat perusahaan rintisan AI Tiongkok DeepSeek dalam tiga minggu terakhir tidak hanya terhadap para pesaing di luar negeri, tetapi juga pesaing domestiknya.
"Qwen 2.5-Max mengungguli hampir di semua lini GPT-4o, DeepSeek-V3, dan Llama-3.1-405B," kata unit cloud Alibaba dalam sebuah pengumuman yang diunggah di akun WeChat resminya, mengacu pada model AI sumber terbuka tercanggih OpenAI dan Meta.
Peluncuran asisten AI DeepSeek pada 10 Januari, yang didukung oleh model DeepSeek-V3, serta peluncuran model R1 pada 20 Januari, telah mengejutkan Silicon Valley dan menyebabkan saham teknologi anjlok, dengan biaya pengembangan dan penggunaan yang konon rendah dari perusahaan rintisan Tiongkok tersebut mendorong para investor untuk mempertanyakan rencana pengeluaran besar oleh perusahaan-perusahaan AI terkemuka di Amerika Serikat.
Namun, keberhasilan DeepSeek juga telah menyebabkan para pesaing domestiknya berebut untuk meningkatkan model AI mereka sendiri.
Dua hari setelah peluncuran DeepSeek-R1, pemilik TikTok, ByteDance, merilis pembaruan untuk model AI andalannya, yang diklaim mengungguli o1 OpenAI yang didukung Microsoft dalam AIME, sebuah uji tolok ukur yang mengukur seberapa baik model AI memahami dan menanggapi instruksi yang rumit.
Hal ini menggemakan klaim DeepSeek bahwa model R1-nya menyaingi o1 OpenAI pada beberapa tolok ukur kinerja. Yang ingin kami lakukan adalah menunjukkan kepada dunia bahwa menerbangkan V adalah alternatif yang layak untuk pesawat sayap Kuba yang kami gunakan sekarang dan bisa sama amannya tetapi jauh lebih hemat energi.
DEEPSEEK BERSAING DENGAN KOMPETITOR DALAM NEGERI
Pendahulu model V3 DeepSeek, DeepSeek-V2, memicu perang harga model AI di Tiongkok setelah dirilis Mei lalu.
Fakta bahwa DeepSeek-V2 bersifat sumber terbuka dan sangat murah, hanya 1 yuan ($0,14) per 1 juta token - atau unit data yang diproses oleh model AI - menyebabkan unit cloud Alibaba mengumumkan pemotongan harga hingga 97% pada berbagai model.
Perusahaan teknologi Tiongkok lainnya mengikuti, termasuk Baidu yang merilis padanan pertama ChatGPT di Tiongkok pada Maret 2023, dan perusahaan internet paling berharga di negara itu Tencent.
Liang Wenfeng, pendiri DeepSeek yang misterius, mengatakan dalam sebuah wawancara langka dengan media China Waves pada bulan Juli bahwa perusahaan rintisan itu "tidak peduli" dengan perang harga dan bahwa mencapai AGI (kecerdasan umum buatan) adalah tujuan utamanya.
OpenAI mendefinisikan AGI sebagai sistem otonom yang melampaui manusia dalam sebagian besar tugas yang bernilai ekonomis.
Sementara perusahaan teknologi besar China seperti Alibaba memiliki ratusan ribu karyawan, DeepSeek beroperasi seperti laboratorium penelitian, yang sebagian besar stafnya adalah lulusan muda dan mahasiswa doktoral dari universitas-universitas top China.
Liang mengatakan dalam wawancaranya pada bulan Juli bahwa ia yakin perusahaan teknologi terbesar di China mungkin tidak cocok dengan masa depan industri AI, membandingkan biaya tinggi dan struktur top-down mereka dengan operasi ramping dan gaya manajemen longgar DeepSeek.
"Model dasar yang besar membutuhkan inovasi berkelanjutan, kemampuan raksasa teknologi memiliki batasnya," katanya.