Hasil pencarian untuk "QWEN"
23:03

Model terbaik Sumber Terbuka Hugging Face

Jin10 Data 9 Juli - Pagi ini, platform sumber terbuka besar yang terkenal di dunia, Hugging Face, merilis model kecil teratas SmolLM3. SmolLM3 hanya memiliki 3 miliar parameter, tetapi kinerjanya jauh melampaui model sumber terbuka sejenis seperti Llama-3.2-3B dan Qwen2.5-3B. Memiliki jendela konteks 128k, mendukung 6 bahasa termasuk Inggris, Prancis, Spanyol, dan Jerman. Mendukung mode inferensi berpikir dalam dan tidak berpikir, pengguna dapat beralih dengan fleksibel.
Lainnya
B7.13%
10:01

Ali bertanya, apa yang baru

QwQ-Max akan segera dirilis dalam versi resmi, di bawah lisensi Apache 2.0, Sumber Terbuka QwQ-Max dan Qwen2.5-Max, dan menyediakan versi yang lebih kecil seperti QwQ-32B, yang dapat diimplementasikan pada perangkat lokal. Bersamaan dengan peluncuran resmi QwQ-Max, juga akan diluncurkan Aplikasi Android dan iOS resmi.
Lainnya
MAX1%
APP0.82%
09:02

Loongson Technology: Prosesor Loongson Sukses Menjalankan Model Besar DeepSeek

Loongson Technology successfully launched the DeepSeek R1 7B model with Loongson 3 CPU, achieving localized deployment, outstanding performance, and excellent cost, providing users with a faster, stronger, and more economical training and inference experience. Loongson is collaborating with partners such as Taichi Yuanqi, Cambricon, Tianshu Zhixin, Alchip Technology, and openEuler to fully develop a multi-modal inference platform for the DeepSeek series models.
Lainnya
  • 1
13:10

Jingwei Hengrun: Perusahaan telah menyebarkan DeepSeek dan Qwen

Jingwei Hengrun menggunakan model besar seperti DeepSeek dan Qwen untuk mengembangkan aplikasi AI profesional, yang mencakup berbagai bidang seperti bantuan cerdas, desain, pengujian, pengoptimalan produk, dan kecerdasan proses bisnis. Aplikasi ini meningkatkan efisiensi kerja, kualitas, dan mengurangi biaya.
Lainnya
  • 3
  • 1
04:19
Golden Ten Data melaporkan pada 29 April bahwa Tongyi K Man meluncurkan model parameter kning Qwen1.5-110B untuk pertama kalinya, menunjukkan kinerja yang sangat baik dalam evaluasi benchmark terpanjang seperti MMLU, TheoremQA, dan GPQA. Saat ini, seri Qwen 1.5 telah mengumpulkan 10 model besar open source, dan jumlah unduhan model Tongyi K Sumber Terbuka telah melebihi 7 juta.
23:02
Portal berita Gold Finance melaporkan bahwa tim Qwen dari Alibaba secara resmi merilis hasil penelitian terbaru mereka - model bahasa besar QwQ-32B, yang mencapai lonjakan kinerja dengan menggunakan penguatan pembelajaran hanya dengan sekitar 1/21 parameter DeepSeek-R1.
  • 1
  • 1
12:16

Paradigma keempat meluncurkan solusi sisi ujung besar ModelHub AIoT

Data Golden 26 Februari, menurut Paradigma Keempat, Paradigma Keempat meluncurkan ModelHub AIoT, solusi pemecahan ujung besar untuk inferensi model. Di ujung pengguna, pengguna dapat dengan mudah menerapkan model distilasi ukuran kecil termasuk DeepSeek R1, Qwen 2.5, seri Llama 2/3, dan menjalankannya secara offline. Pengguna dapat dengan fleksibel beralih di antara beberapa model, memperhatikan kompresi model, performa inferensi, dan memecahkan kompleksitas implementasi dan optimalisasi. Perusahaan menyatakan bahwa solusi ini tidak hanya dapat memenuhi kebutuhan pengguna akan privasi dan real-time, tetapi juga secara signifikan menurunkan biaya inferensi model AI besar.
Lainnya
09:58

Paradigma keempat meluncurkan solusi mesin inferensi besar all-in-one SageOne IA

Paradigma Keempat meluncurkan SageOneIA, menyusun biaya inferensi model besar. Teknologi pooling Daya Komputasi cerdas terintegrasi dalam solusi all-in-one, mendukung beberapa model besar mainstream, perusahaan dapat beralih antara versi penuh dan distilasi model, meningkatkan penggunaan GPU lebih dari 30%, kinerja inferensi meningkat 5-10 kali.
Lainnya
11:29

AliExpress telah terhubung dengan model besar DeepSeek

Data Gold 12 Februari, Ali International Station AI telah terhubung ke model besar seperti DeepSeek, yang akan sepenuhnya diterapkan pada setiap inti bisnis perdagangan luar negeri. Setelah terhubung, AI saat melayani pelanggan luar negeri secara otomatis, akan dapat lebih menyeluruh mempertimbangkan niat pembeli yang ditanyakan, kemudian menggabungkan wawasan pasar di Ali International Station, pengalaman perdagangan luar negeri, dan situasi produk penjual untuk penalaran Kedalaman. Selain itu, diketahui bahwa Ali International Station juga sedang menguji pertanyaan umum Qwen
Lainnya
23:46

Kerangka Inovasi Microsoft Sumber Terbuka: Mengubah DeepSeek menjadi AI Agent

Microsoft telah merilis versi terbaru OmniParser V2.0, meningkatkan efisiensi dan akurasi AI Agent yang digunakan di komputer, terutama dalam peningkatan deteksi elemen UI kecil dan kecepatan penalaran. Versi ini juga menunjukkan peningkatan kinerja yang signifikan dalam uji coba AgentBenchmark resolusi tinggi, mencapai akurasi mencengangkan 39.6%. Selain itu, Microsoft juga telah merilis secara terbuka alat kunci omnitool untuk mengubah model besar menjadi Agent.
Lainnya
AGENT-2.41%
GPT-1.71%
  • 2
  • 4
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)