Facebook chính thức tham chiến mặt trận siêu AI

Rate this post

Meta, công ty mẹ của Facebook, công bố Chatbot AI LLaMA với 65 tỷ tham số, kém ChatGPT nhưng được huấn luyện trên 1.400 tỷ từ, gấp năm lần mô hình OpenAI.

Ngày 24/2, Meta cho biết đã phát hành mô hình ngôn ngữ mới tên LLaMA cho các nhà nghiên cứu. Mô hình này làm nóng cuộc đua siêu AI khi các công ty công nghệ lớn đều đang không thể đứng ngoài xu hướng trí tuệ nhân tạo.

LLaMA được viết tắt từ Large Language Model Meta AI (Mô hình Ngôn ngữ Lớn về AI của Meta). Nó hoạt động dưới dạng mở, cho phép các nhà nghiên cứu và tổ chức chính phủ, xã hội, học viện dùng miễn phí.

Trước mắt, LLaMA sẽ tập trung cho 20 ngôn ngữ dùng bảng chữ cái Latinh và Cyrillic. Tiếng Việt chưa nằm trong danh sách này. Theo công bố, mô hình của Meta đòi hỏi sức mạnh tính toán “ít hơn nhiều” so với các siêu AI trước đó. Nó có tối đa 65 tỷ tham số, bằng một phần ba so với ChatGPT, nhưng lại được huấn luyện trên 1.400 tỷ từ, cao gấp năm lần siêu AI của OpenAI.

Các mô hình ngôn ngữ lớn khai thác một lượng lớn văn bản để tóm tắt thông tin và tạo nội dung., từ đó, chúng có thể trả lời các câu hỏi theo ngữ cảnh như con người.

Mặt trận siêu AI khởi động từ cuối năm ngoái khi OpenAI phát hành ChatGPT. Sau đó, Microsoft tuyên bố tích hợp mô hình này vào công cụ tìm kiếm Bing. Google đáp lại bằng chatbot Bard AI nhưng mới đang thử nghiệm nội bộ. Một số công ty công nghệ lớn ở châu Á như Baidu cũng xây dựng sản phẩm tương tự để cạnh tranh.

Gil Luria, nhà phân tích cao cấp tại DA Davidson, nói: “Thông báo của Meta có thể là bước thăm dò về năng lực của mô hình ngôn ngữ lớn. Sau đó, họ sẽ đưa siêu AI vào sản phẩm của mình trong tương lai. Mô hình của Meta có thể không mạnh bằng ChatGPT nhưng rõ ràng sẽ đóng vai trò quan trọng với mô hình kinh doanh của công ty”.

Meta tuyên bố LLaMA có thể vượt trội các đối thủ trong một số tình huống cụ thể. Với 65 tỷ tham số, nó cho thấy sức mạnh không thua kém Chinchilla70B và PaLM-540B của Google. Tháng 5/2022, Meta cũng đã phát hành mô hình ngôn ngữ lớn OPT-175B, tạo cơ sở cho phiên bản chatbot BlenderBot 3. Sau đó, công ty giới thiệu mô hình Galactica có thể viết bài báo khoa học và giải các bài toán. Tuy nhiên, cả hai AI này đều nhanh chóng bị gỡ bỏ do liên quan đến vấn đề bản quyền và thông tin sai lệch.

(Theo Reuters)