BEIJING - DeepSeek ingin memanfaatkan keunggulannya. Perusahaan rintisan asal Tiongkok itu memicu aksi jual lebih dari $1 triliun di pasar ekuitas global bulan lalu dengan model penalaran AI murah yang mengungguli banyak pesaing Barat.
Sekarang, perusahaan yang berpusat di Hangzhou itu mempercepat peluncuran penerus model R1 bulan Januari, menurut tiga orang yang mengetahui perusahaan itu.
Deepseek telah merencanakan untuk merilis R2 pada awal Mei tetapi sekarang menginginkannya keluar sedini mungkin, kata dua orang dari mereka, tanpa memberikan rincian.
Perusahaan itu mengatakan mereka berharap model baru itu akan menghasilkan pengodean yang lebih baik dan mampu bernalar dalam bahasa selain bahasa Inggris. Rincian tentang percepatan jadwal peluncuran R2 belum pernah dilaporkan sebelumnya.
DeepSeek tidak menanggapi permintaan komentar untuk berita ini.
Para pesaing masih mencerna implikasi dari R1, yang dibangun dengan chip Nvidia yang kurang bertenaga tetapi kompetitif dengan yang dikembangkan dengan biaya ratusan miliar dolar oleh raksasa teknologi AS.
"Peluncuran model R2 DeepSeek bisa menjadi momen penting dalam industri AI," kata Vijayasimha Alilughatta, kepala operasi penyedia layanan teknologi India Zensar.
Keberhasilan DeepSeek dalam menciptakan model AI yang hemat biaya "kemungkinan akan memacu perusahaan di seluruh dunia untuk mempercepat upaya mereka sendiri ... mematahkan cengkeraman beberapa pemain dominan di bidang tersebut," katanya.
R2 kemungkinan akan membuat pemerintah AS khawatir, yang telah mengidentifikasi kepemimpinan AI sebagai prioritas nasional.
Peluncurannya dapat semakin menggembirakan otoritas dan perusahaan Tiongkok, yang puluhan di antaranya mengatakan bahwa mereka telah mulai mengintegrasikan model DeepSeek ke dalam produk mereka.
Sedikit yang diketahui tentang DeepSeek, yang pendirinya Liang Wenfeng menjadi miliarder melalui dana lindung nilai kuantitatifnya High-Flyer. Liang, yang digambarkan oleh mantan majikannya sebagai "orang yang rendah hati dan tertutup," tidak berbicara kepada media mana pun sejak Juli 2024.
Reuters mewawancarai belasan mantan karyawan, serta profesional dana kuantitatif yang memiliki pengetahuan tentang operasi DeepSeek dan perusahaan induknya High-Flyer. Reuters juga meninjau artikel media pemerintah, unggahan media sosial dari perusahaan, dan makalah penelitian yang berasal dari tahun 2019.
Mereka menceritakan kisah tentang sebuah perusahaan yang berfungsi lebih seperti laboratorium penelitian daripada perusahaan yang mencari laba dan tidak terbebani oleh tradisi hierarkis industri teknologi bertekanan tinggi di Tiongkok, bahkan saat perusahaan tersebut menjadi penanggung jawab atas apa yang dilihat banyak investor sebagai terobosan terbaru dalam AI.
JALAN YANG BERBEDA
Liang lahir pada tahun 1985 di sebuah desa pedesaan di provinsi selatan Guangdong. Ia kemudian memperoleh gelar teknik komunikasi di Universitas Zhejiang yang elit.
Salah satu pekerjaan pertamanya adalah menjalankan departemen penelitian di sebuah perusahaan pencitraan pintar di Shanghai.
Atasannya saat itu, Zhou Chaoen, mengatakan kepada media pemerintah pada 9 Februari bahwa Liang telah merekrut insinyur algoritma pemenang penghargaan dan beroperasi dengan "gaya manajemen yang datar."
Di DeepSeek dan High-Flyer, Liang juga menjauhi praktik raksasa teknologi Tiongkok yang dikenal dengan manajemen top-down yang kaku, gaji rendah untuk karyawan muda, dan "996" - bekerja dari pukul 9 pagi hingga 9 malam, enam hari seminggu.
Liang membuka kantornya di Beijing dalam jarak berjalan kaki dari Universitas Tsinghua dan Universitas Peking, dua lembaga pendidikan paling bergengsi di Tiongkok.
Dia secara teratur mempelajari detail teknis dan senang bekerja bersama pekerja magang Gen-Z dan lulusan baru yang merupakan sebagian besar tenaga kerjanya, menurut dua mantan karyawan.
Mereka juga menggambarkan biasanya bekerja delapan jam sehari dalam suasana kolaboratif. "Liang memberi kami kendali dan memperlakukan kami sebagai ahli. Dia terus-menerus mengajukan pertanyaan dan belajar bersama kami," kata peneliti berusia 26 tahun Benjamin Liu, yang meninggalkan perusahaan pada bulan September.
"DeepSeek memungkinkan saya mengambil alih kepemilikan bagian-bagian penting dari alur kerja, yang sangat mengasyikkan." Liang tidak menanggapi pertanyaan yang dikirim melalui DeepSeek.
Sementara Baidu dan raksasa teknologi Tiongkok lainnya berlomba-lomba membangun versi ChatGPT yang ditujukan untuk konsumen pada tahun 2023 dan mendapat keuntungan dari ledakan AI global, Liang mengatakan kepada media Tiongkok Waves tahun lalu bahwa ia sengaja menghindari pengeluaran besar untuk pengembangan aplikasi, sebaliknya berfokus pada penyempurnaan model AI.
Baik DeepSeek maupun High-Flyer dikenal membayar dengan murah hati, menurut tiga orang yang mengetahui praktik kompensasinya.
Di High-Flyer, bukan hal yang aneh bagi seorang ilmuwan data senior untuk menghasilkan 1,5 juta yuan per tahun, sementara pesaing jarang membayar lebih dari 800.000, kata salah satu orang tersebut, seorang manajer dana kuantitatif saingan yang mengenal Liang.
Kedermawanan tersebut didanai oleh High-Flyer, yang menjadi salah satu dana kuantitatif tersukses di Tiongkok dan, bahkan setelah tindakan keras pemerintah terhadap sektor tersebut, masih mengelola puluhan miliar yuan, menurut dua orang di industri tersebut.
DAYA KOMPUTASI
Keberhasilan DeepSeek dengan model AI berbiaya rendah didasarkan pada investasi High-Flyer selama satu dekade dan substansial dalam penelitian dan daya komputasi, kata tiga orang.
Dana kuantitatif tersebut merupakan pelopor awal dalam perdagangan AI dan seorang eksekutif puncak mengatakan pada tahun 2020 bahwa High-Flyer akan "berinvestasi penuh" pada AI dengan menginvestasikan kembali 70% dari pendapatannya, sebagian besar untuk penelitian AI.
High-Flyer menghabiskan 1,2 miliar yuan untuk dua klaster AI superkomputer pada tahun 2020 dan 2021. Klaster kedua, Fire-Flyer II, terdiri dari sekitar 10.000 chip Nvidia A100, yang digunakan untuk melatih model AI.
DeepSeek belum berdiri pada saat itu, sehingga akumulasi daya komputasi menarik perhatian regulator sekuritas Tiongkok, kata seseorang yang memiliki pengetahuan langsung tentang pemikiran pejabat.
"Regulator ingin tahu mengapa mereka membutuhkan begitu banyak chip?" kata orang tersebut. "Bagaimana mereka akan menggunakannya? Dampak seperti apa yang akan terjadi pada pasar?"
Pihak berwenang memutuskan untuk tidak campur tangan, dalam sebuah langkah yang terbukti penting bagi nasib DeepSeek: AS melarang ekspor chip A100 ke China pada tahun 2022, saat Fire-Flyer II sudah beroperasi.
Beijing sekarang merayakan DeepSeek, tetapi telah menginstruksikannya untuk tidak terlibat dengan media tanpa persetujuan, menurut seseorang yang mengetahui pemikiran resmi China.
Pihak berwenang telah meminta Liang untuk tidak menonjolkan diri karena mereka khawatir bahwa terlalu banyak sensasi di media akan menarik perhatian yang tidak perlu, kata orang tersebut.
Kabinet dan kementerian perdagangan China, serta regulator sekuritas China, tidak menanggapi permintaan komentar.
Sebagai salah satu dari sedikit perusahaan dengan klaster A100 yang besar, High-Flyer dan DeepSeek mampu menarik beberapa talenta penelitian terbaik China, kata dua mantan karyawan.
"Keuntungan utama dari sumber daya (komputasi) yang besar adalah memungkinkan eksperimen skala besar," kata Liu, mantan karyawan tersebut.
Beberapa pengusaha AI Barat, seperti CEO Scale AI Alexandr Wang, mengklaim bahwa DeepSeek memiliki sebanyak 50.000 chip Nvidia kelas atas yang dilarang untuk diekspor ke Tiongkok. Ia belum memberikan bukti atas tuduhan tersebut atau menanggapi permintaan Reuters untuk memberikan bukti.
DeepSeek belum menanggapi klaim Wang. Dua mantan karyawan mengaitkan keberhasilan perusahaan dengan fokus Liang pada arsitektur AI yang lebih hemat biaya.
Harga DeepSeek 20 hingga 40 kali lebih murah daripada yang dibebankan OpenAI untuk model yang setara, analis di pialang Bernstein memperkirakan pada awal Februari.
Untuk saat ini, raksasa teknologi Barat dan Tiongkok telah mengisyaratkan rencana untuk melanjutkan pengeluaran AI yang besar, tetapi keberhasilan DeepSeek dengan R1 dan model V3 sebelumnya telah mendorong beberapa orang untuk mengubah strategi.
OpenAI memangkas harga bulan ini, sementara Gemini dari Google telah memperkenalkan tingkatan akses yang didiskon. Sejak peluncuran R1, OpenAI juga telah merilis model O3-Mini yang mengandalkan daya komputasi yang lebih sedikit.
Adnan Masood dari penyedia layanan teknologi AS UST mengatakan kepada Reuters bahwa laboratoriumnya telah menjalankan tolok ukur yang menemukan R1 sering menggunakan tiga kali lebih banyak token, atau unit data yang diproses oleh model AI, untuk penalaran dibandingkan model OpenAI yang diperkecil.
PENERIMAAN NEGARA
Bahkan sebelum R1 menarik perhatian global, ada tanda-tanda bahwa DeepSeek telah menarik perhatian Beijing. Pada bulan Januari, media pemerintah melaporkan bahwa Liang menghadiri pertemuan dengan Perdana Menteri Tiongkok Li Qiang di Beijing sebagai perwakilan yang ditunjuk dari sektor AI, mendahului para pemimpin perusahaan yang lebih terkenal.
Kehebohan berikutnya mengenai daya saing biaya model-modelnya telah meningkatkan keyakinan Beijing bahwa mereka dapat mengungguli AS dalam berinovasi, dengan perusahaan-perusahaan Tiongkok dan badan-badan pemerintah merangkul model-model DeepSeek dengan kecepatan yang belum pernah ditawarkan kepada perusahaan-perusahaan lain.
Setidaknya 13 pemerintah kota Tiongkok dan 10 perusahaan energi milik negara Perusahaan teknologi mengatakan mereka telah menerapkan DeepSeek ke dalam sistem mereka. Sementara raksasa teknologi Lenovo, Baidu, dan Tencent - pemilik aplikasi media sosial terbesar di Tiongkok WeChat - telah mengintegrasikan model DeepSeek ke dalam produk mereka.
Pemimpin Tiongkok Xi Jinping dan Li "telah mengisyaratkan bahwa mereka mendukung DeepSeek," kata Alfred Wu, seorang pakar pembuatan kebijakan Tiongkok di Sekolah Kebijakan Publik Lee Kuan Yew Singapura. "Sekarang semua orang mendukungnya."
Penerimaan Tiongkok datang ketika pemerintah dari Korea Selatan hingga Italia menghapus DeepSeek dari toko aplikasi nasional, dengan alasan masalah privasi.
"Jika DeepSeek menjadi model AI pilihan di seluruh entitas negara Tiongkok, regulator Barat mungkin melihat ini sebagai alasan lain untuk meningkatkan pembatasan pada chip AI atau kolaborasi perangkat lunak," kata Stephen Wu, seorang pakar AI dan pendiri dana lindung nilai Carthage Capital.
Batasan lebih lanjut pada chip AI canggih merupakan tantangan yang diakui Liang. "Masalah kami bukan soal pendanaan," katanya kepada Waves pada bulan Juli. "Masalahnya adalah embargo chip kelas atas."