Theo TechCrunch đưa tin ngày 19/7, OpenAI mô tả GPT-4o mini là mô hình nhỏ có dung lượng nhẹ hơn đáng kể so với phiên bản đầy đủ GPT-4o và có sức mạnh tương đương với GPT-3.5.
Mặc dù kích thước nhỏ gọn hơn, GPT-4o mini vẫn đạt được điểm số cao hơn trong các bài kiểm tra về trí tuệ và hiệu suất. GPT-4o mini đạt điểm số 82% với tiêu chuẩn ngành MMLU bao gồm 16.000 câu hỏi trắc nghiệm ở 57 chủ đề học thuật. Trên cùng tiêu chuẩn, GPT-4o đạt 88,7% trong khi GPT-3.5 chỉ được chấm 70% điểm. MMLU là chỉ số đo lường khả năng hiểu ngôn ngữ đa nhiệm lớn. Điểm MMLU cao hơn biểu thị rằng nó có thể hiểu và sử dụng ngôn ngữ tốt hơn trên nhiều lĩnh vực khác nhau, nâng cao khả năng sử dụng trong thế giới thực.
Điểm nổi bật của GPT-4o mini nằm ở hiệu quả chi phí vượt trội. Mô hình mới này có chi phí vận hành thấp hơn 60% so với phiên bản tiền nhiệm GPT-3.5 turbo.
OpenAI ra mắt phiên bản thu nhỏ của mô hình GPT-4o. |
Bắt đầu từ ngày 19/7, GPT-4o Mini sẽ được phân phối miễn phí cho người dùng ChatGPT, gói ChatGPT Plus và Team. Còn đối với người dùng ChatGPT Enterprise sẽ khả dụng trong tuần tới. Trong tương lai, OpenAI có kế hoạch tích hợp thêm tính năng về hình ảnh, video và âm thanh vào mô hình GPT-4o mini.
Giới chuyên gia nhận đinh, sự ra đời của GPT-4o mini phản ánh một sự chuyển dịch quan trọng trong định hướng của OpenAI. Thay vì tập trung vào việc phát triển các mô hình AI quy mô lớn và tốn kém như trước đây, công ty đang hướng tới sự cân bằng giữa quy mô và hiệu quả.
Mục tiêu của OpenAI là tạo ra các mô hình nhỏ gọn hơn, có khả năng sinh lời cao hơn và đáp ứng tốt hơn nhu cầu của các doanh nghiệp cần giải pháp AI cho những tác vụ cụ thể.
Không riêng OpenAI, các tập đoàn công nghệ lớn như Google và Microsoft cùng các startup đầy tiềm năng như Anthropic, Mistral và Cohere cũng đang theo đuổi hướng đi tương tự.
Chẳng hạn, hồi tháng 4/2024, Microsoft ra mắt mô hình AI nhỏ hơn có tên Phi-3-mini nhằm thu hút lượng khách hàng rộng hơn với các tùy chọn tiết kiệm chi phí.
Lý do cho xu hướng này là các mô hình này dễ dàng phát triển hơn, yêu cầu ít dữ liệu và tài nguyên tính toán hơn, đồng thời có khả năng vận hành trực tiếp trên các thiết bị di động.