Follow Us

facebookyoutube_channeltwitter

Alibaba Cloud Buka Sumber Kode Model LLM Berparameter 7 Miliar

Ida Bagus Artha Kusuma - Selasa, 08 Agustus 2023 | 20:45
Alibaba Cloud membuka sumber kode Model Bahasa Besar (Large Language Models-LLM) berparameter 7 miliar yaitu Qwen-7B dan Qwen-7B-Chat
Alibaba Cloud

Alibaba Cloud membuka sumber kode Model Bahasa Besar (Large Language Models-LLM) berparameter 7 miliar yaitu Qwen-7B dan Qwen-7B-Chat

nextren.com -Alibaba Cloud telah membuka sumber kode Model Bahasa Besar (Large Language Models-LLM) berparameter 7 miliar.

Langkah ini dilakukan melalui kerjasama dengan komunitas model kecerdasan buatan ModelScope dan platform kolaboratif Hugging Face.

Hal ini dianggap langkah berani dalam mendukung komunitas sumber terbukaatau OperSource.

Model bahasa besar ini, dikenal dengan nama Tongyi Qianwen, pertama kali diperkenalkan oleh Alibaba Cloud pada bulan April tahun ini.

Model ini memiliki kemampuan dalam menghasilkan konten berbahasa Mandarin dan Inggris yang sangat mirip dengan gaya manusia.

Perilisan sumber kode ini mencakup model Qwen-7B dengan parameter 7 miliar serta versi percakapan yang disesuaikan, yaitu Qwen-7B-Chat.

Dalam upaya untuk mendorong inklusivitas teknologi kecerdasan buatan, Alibaba Cloud secara terbuka membagikan kode model, bobot model, dan dokumentasi terkait kepada kalangan akademisi, peneliti, dan lembaga komersial di seluruh dunia.

Perusahaan juga memberikan kemudahan bagi perusahaan dengan pengguna aktif bulanan kurang dari 100 juta untuk menggunakan model ini secara gratis untuk keperluan komersial.

Sementara itu, perusahaan dengan jumlah pengguna yang lebih besar dapat meminta lisensi dari Alibaba Cloud.

Jingren Zhou, CTO Alibaba Cloud Intelligence, menjelaskan, "Dengan melepas sumber kode model bahasa besar eksklusif kami, tujuan kami adalah memajukan teknologi inklusif dan memberikan kesempatan kepada lebih banyak pengembang dan UMKM untuk menggali manfaat dari AI generatif."

"Sebagai pendukung komitmen jangka panjang terhadap inisiatif sumber terbuka, kami berharap langkah ini akan mendorong kebijaksanaan kolektif dan memajukan perkembangan komunitas sumber terbuka."

Baca Juga: Alibaba Cloud Raih Posisi Challenger dalam Gartner Magic Quadrant

Model Qwen-7B telah menjalani pelatihan pada lebih dari 2 triliun token yang mencakup berbagai jenis materi berbahasa Mandarin, Inggris, dan multibahasa lainnya, termasuk materi dalam berbagai bidang umum dan profesional.

Model ini memiliki konteks yang panjang, mencapai 8K token.

Selama proses pelatihan, model Qwen-7B-Chat dipoles dengan bimbingan dari instruksi manusia.

Baik Qwen-7B maupun Qwen-7B-Chat dapat diimplementasikan pada infrastruktur cloud maupun lokal, memungkinkan pengguna untuk menyesuaikan ulang model ini dan membangun model generatif berkualitas tinggi secara efektif dan efisien.

Prestasi model Qwen-7B juga patut diperhatikan, karena model ini berhasil mencetak skor tinggi dalam uji benchmark Massive Multi-task Language Understanding (MMLU) dengan skor impresif 56,7.

Hasil ini mengungguli model open-source lainnya dengan skala serupa atau bahkan model yang lebih besar.

Uji benchmark ini mengukur akurasi model dalam 57 tugas beragam, termasuk bidang matematika dasar, ilmu komputer, dan hukum.

Alibaba Cloud juga meraih prestasi dalam uji benchmark bahasa Mandarin, dengan Qwen-7B mencatat skor tertinggi dalam leaderboard C-Eval untuk model dasar dalam bahasa Mandarin.

Model ini juga menunjukkan kinerja unggul dalam uji benchmark matematika dan pembuatan kode, seperti GSM8K dan HumanEval.

Alibaba Cloud terus mengambil langkah maju dalam dunia kecerdasan buatan dengan pengumuman ini.

Pada bulan Juli, perusahaan memperkenalkan penghasil gambar AI, Tongyi Wanxiang, yang didesain untuk mendukung pengembangan kreativitas gambar oleh pengembang dan UMKM.

Baca Juga: Alibaba Ingin Buat Pesaing ChatGPT, Chatbot Asal China Pertama?

ModelScopeGPT juga dihadirkan oleh Alibaba Cloud sebagai kerangka serbaguna untuk membantu pengguna dalam tugas-tugas AI yang kompleks dan spesifik di berbagai bidang bahasa, visi, dan ucapan.

Untuk informasi lebih lanjut mengenai Qwen-7B dan Qwen-7B-Chat, informasi dapat diakses melalui halaman ModelScope, Hugging Face, dan GitHub.

Dengan langkah besar ini, Alibaba Cloud telah membuka pintu untuk kolaborasi dan inovasi lebih lanjut dalam pengembangan kecerdasan buatan yang inklusif dan bermanfaat bagi banyak pihak.

Baca Juga: 3 Program Terbaru Untuk Developer Di Alibaba Cloud Developer Summit 2023

(*)

Editor : Nextren

Baca Lainnya





PROMOTED CONTENT

Latest

x