Chính thức ra mắt Gemini - AI lớn nhất từ trước tới nay của Google

Đêm 6/12 (theo giờ Việt Nam), Google đã chính thức giới thiệu Gemini - mô hình Trí tuệ nhân tạo được cho là lớn nhất và tối ưu nhất của hãng, được đánh giá có khả năng cạnh tranh với GPT-4 của Open AI.

Bà Sissie Hsiao - Phó chủ tịch sản phẩm Google, phụ trách Bard (Công cụ AI đàm thoại của Google mới được ra mắt vào tháng 3/2023) cho biết: "Gemini có khả năng suy luận đa phương thức phức tạp. Với thiết kế linh hoạt, Gemini được tối ưu hóa với ba kích cỡ khác nhau: Ultra, Pro và Nano để có thể hoạt động trên mọi thứ, từ Trung tâm Dữ liệu đến thiết bị di động."

Bà Sissie Hsiao tiết lộ Gemini sắp được tích hợp vào Bard trong bản nâng cấp lớn nhất từ trước đến nay. Gemini sẽ được triển khai cho Bard theo hai giai đoạn: "Bắt đầu từ hôm nay, Bard sẽ sử dụng phiên bản Gemini Pro được điều chỉnh cụ thể bằng tiếng Anh để có thể lập luận nâng cao, lên kế hoạch, hiểu và hơn thế nữa. Vào đầu năm sau, chúng tôi sẽ giới thiệu Bard Advanced, phiên bản cho phép bạn truy cập đầu tiên vào các mô hình với khả năng tân tiến nhất của chúng tôi, bắt đầu với Gemini Ultra."

Bà Sissie Hsiao cũng cho biết trước khi ra mắt công chúng, hãng đã cho vận hành Gemini Pro thông qua một số điểm chuẩn tiêu chuẩn ngành. Trong 6 trên 8 tiêu chuẩn, Gemini Pro hoạt động tốt hơn GPT 3.5, bao gồm tiêu chuẩn MMLU (Massive Multitask Language Understanding; tạm dịch: Hiểu ngôn ngữ đa nhiệm lớn), là một trong những tiêu chuẩn hàng đầu để đo lường các mô hình AI lớn, và cả tiêu chuẩn GSM8K dùng để đo lường khả năng tư duy toán học ở cấp độ phổ thông.

Google cũng điều chỉnh Gemini Pro trong Bard để có khả năng ưu việt hơn trong việc hiểu, tóm tắt, lý luận, lập trình và lập kế hoạch. "Chúng tôi đang nhận thấy những kết quả tuyệt vời: Trong các đánh giá ẩn danh với các chuyên gia đánh giá của bên thứ ba, Bard hiện là chatbot miễn phí được ưa chuộng nhất so với các lựa chọn thay thế hàng đầu," bà Sissie Hsiao nói.

Ngay hôm nay, người dùng có thể bắt đầu dùng thử phiên bản Bard tích hợp Gemini Pro với các prompt tạo văn bản, các phương thức khác sẽ sớm được hỗ trợ. Nó sẽ có trong tiếng Anh ở hơn 170 quốc gia và vùng lãnh thổ, trong tương lai gần sẽ bổ sung thêm trong nhiều ngôn ngữ và địa điểm hơn, chẳng hạn như châu Âu.

Bà Sissie Hsiao cũng giới thiệu Gemini Ultra - mô hình lớn và tiên tiến nhất của công ty. Gemini Ultra được thiết kế cho các tác vụ có độ phức tạp cao và được xây dựng để nhận biết cũng như xử lý nhanh chóng các loại thông tin khác nhau bao gồm văn bản, hình ảnh, âm thanh, video và mã hóa.

"Một trong những cách đầu tiên để bạn có thể dùng thử Gemini Ultra là thông qua Bard Advanced. Đây là trải nghiệm AI mới và tiên tiến trong Bard, cung cấp cho bạn quyền truy cập vào các mô hình với khả năng tốt nhất của chúng tôi. Chúng tôi hiện đang hoàn tất các cuộc thử nghiệm về độ an toàn ở quy mô lớn và sẽ triển khai chương trình thử nghiệm đáng tin cậy trước khi cho ra mắt Bard Advanced đến nhiều người hơn vào đầu năm sau," bà chia sẻ.

Ông Sundar Pichai - CEO Google và Alphabet cho biết AI có tiềm năng tạo ra cơ hội - từ những điều bình thường đến những điều phi thường - cho mọi người ở khắp mọi nơi. Nó sẽ mang đến những làn sóng đổi mới và tiến bộ kinh tế mới đồng thời thúc đẩy kiến thức, học tập, sáng tạo và năng suất ở quy mô mà chúng ta chưa từng thấy trước đây.

Vị CEO này cũng khẳng định hãng đang thực hiện bước tiếp theo trên hành trình với Gemini. Kỷ nguyên mới của các mô hình này đại diện cho một trong những nỗ lực khoa học và kỹ thuật lớn nhất mà "gã khổng lồ" công nghệ Thế giới đang thực hiện.

Gemini là mô hình AI đa phương thức do bộ phận Google DeepMind nghiên cứu và phát triển, được đề cập lần đầu hồi tháng 5 tại sự kiện Google I/O 2023. Đây được xem là "nỗ lực nghiêm túc nhất" của Google trong cơn sốt AI tạo sinh.

Đây là dự án đầy tham vọng của Google và hoạt động tương tự mô hình GPT-4 hiện có trên ChatGPT. Với Gemini, Google đang tiến một bước gần hơn tới viễn cảnh khiến Bard trở thành cộng sự AI đắc lực nhất thế giới./.

Theo Vietnam+