CEO Mistral AI thông báo về mô hình cấp độ GPT-4 mã nguồn mở vào năm 2024

Arthur Mensch, CEO của startup Pháp Mistral AI, đã thông báo trên đài phát thanh quốc gia Pháp rằng công ty dự định mở mã nguồn mô hình cấp độ GPT-4 vào năm 2024, điều này đã thu hút sự chú ý trong ngành công nghiệp.

Gần đây, Mistral AI đã ra mắt mô hình 8X7B dựa trên kiến trúc MoE, có thể so sánh với các mô hình phổ biến khác như GPT3.5 và Llama270B, và vượt trội hơn Llama270B với tốc độ suy luận nhanh gấp 6 lần trong hầu hết các bài kiểm tra. Mô hình này được cấp phép theo giấy phép Apache 2.0, mang lại sự linh hoạt lớn hơn cho các nhà phát triển.

Sau khi tin tức lan truyền, nó đã gây ra một cuộc thảo luận sôi nổi trên mạng xã hội. Một người dùng đã bày tỏ lo ngại về lợi nhuận trong tương lai của Mistral AI, đặc biệt sau khi phát hành mô hình 7B mà họ gọi là “Mistral Tiny”. Điều này cũng tạo ra sự tò mò về mô hình “Mistral Medium” sắp tới.

Mistral AI chia các mô hình của mình thành ba danh mục: Mistral Tiny, Mistral Small và Mistral Medium. Hiện tại, Mistral7B Instruct v0.2 và Mixtral8x7B đã được phát hành thuộc về Mistral Tiny và Mistral Small tương ứng. Thú vị là mô hình Mistral Medium chưa được phát hành, nhưng công ty cho biết đang trong quá trình phát triển và sẽ dẫn đầu bảng xếp hạng trên các bài kiểm tra tiêu chuẩn.

Công ty gần đây thông báo đã nhận được 415 triệu đô la vốn, định giá 2 tỷ đô la. Vòng gọi vốn mới nhất do Andreessen Horowitz (a16z) dẫn đầu, và Lightspeed Venture Partners cũng tham gia đầu tư tiếp. Để giải quyết vấn đề bền vững thương mại mà các công ty mô hình ngôn ngữ lớn mã nguồn mở đang đối mặt, Mistral AI gần đây đã ra mắt “La Plateforme” để cung cấp các điểm cuối API cho các mô hình có sẵn của mình.

Ngoài ra, Mistral AI đang làm việc để phát triển mô hình Mistral Medium hỗ trợ đa ngôn ngữ, hoạt động tốt trong tiếng Anh, tiếng Pháp, tiếng Ý, tiếng Đức, tiếng Tây Ban Nha và mã nguồn, đạt 8,6 điểm trong điểm MT-Bench, thậm chí vượt qua GPT3 .5.

Đáng chú ý là cùng lúc đó, những tin đồn rằng OpenAI có thể phát hành GPT-4.5 vào cuối năm cũng đang lan truyền trong ngành công nghiệp. Điều này khiến năm 2024 tràn đầy kỳ vọng và cạnh tranh trong lĩnh vực mô hình ngôn ngữ lớn mã nguồn mở.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

You cannot copy content of this page