Follow Us

facebookyoutube_channeltwitter

Alibaba Cloud Buka Sumber Kode Model LLM Berparameter 7 Miliar

Ida Bagus Artha Kusuma - Selasa, 08 Agustus 2023 | 20:45
Alibaba Cloud membuka sumber kode Model Bahasa Besar (Large Language Models-LLM) berparameter 7 miliar yaitu Qwen-7B dan Qwen-7B-Chat
Alibaba Cloud

Alibaba Cloud membuka sumber kode Model Bahasa Besar (Large Language Models-LLM) berparameter 7 miliar yaitu Qwen-7B dan Qwen-7B-Chat

Baca Juga: Alibaba Cloud Raih Posisi Challenger dalam Gartner Magic Quadrant

Model Qwen-7B telah menjalani pelatihan pada lebih dari 2 triliun token yang mencakup berbagai jenis materi berbahasa Mandarin, Inggris, dan multibahasa lainnya, termasuk materi dalam berbagai bidang umum dan profesional.

Model ini memiliki konteks yang panjang, mencapai 8K token.

Selama proses pelatihan, model Qwen-7B-Chat dipoles dengan bimbingan dari instruksi manusia.

Baik Qwen-7B maupun Qwen-7B-Chat dapat diimplementasikan pada infrastruktur cloud maupun lokal, memungkinkan pengguna untuk menyesuaikan ulang model ini dan membangun model generatif berkualitas tinggi secara efektif dan efisien.

Prestasi model Qwen-7B juga patut diperhatikan, karena model ini berhasil mencetak skor tinggi dalam uji benchmark Massive Multi-task Language Understanding (MMLU) dengan skor impresif 56,7.

Hasil ini mengungguli model open-source lainnya dengan skala serupa atau bahkan model yang lebih besar.

Uji benchmark ini mengukur akurasi model dalam 57 tugas beragam, termasuk bidang matematika dasar, ilmu komputer, dan hukum.

Alibaba Cloud juga meraih prestasi dalam uji benchmark bahasa Mandarin, dengan Qwen-7B mencatat skor tertinggi dalam leaderboard C-Eval untuk model dasar dalam bahasa Mandarin.

Model ini juga menunjukkan kinerja unggul dalam uji benchmark matematika dan pembuatan kode, seperti GSM8K dan HumanEval.

Alibaba Cloud terus mengambil langkah maju dalam dunia kecerdasan buatan dengan pengumuman ini.

Pada bulan Juli, perusahaan memperkenalkan penghasil gambar AI, Tongyi Wanxiang, yang didesain untuk mendukung pengembangan kreativitas gambar oleh pengembang dan UMKM.

Editor : Nextren

Baca Lainnya





PROMOTED CONTENT

Latest

x