Công nghệ

Google vừa trình làng bản nâng cấp mới mạnh mẽ cho Gemini



Nếu có cảm giác như Google đang tấn công chúng ta bằng những thông báo của Song Tử, thì đó là vì đúng như vậy. Tuần trước, công ty đã đổi thương hiệu bot AI của mình, Bard, thành Gemini và giới thiệu Gemini Advanced, tầng đăng ký AI trả phí đầu tiên của họ. Ngay sau thông báo đó là Gemini 1.5, phiên bản tiếp theo của mô hình AI của Google.

Song Tử 1.5 là gì?

Google cho biết Gemini 1.5 được xây dựng trên kiến ​​trúc Transformer và Mixture-of-Experts (MoE). So với kiến ​​trúc Transformer truyền thống, về cơ bản là một mạng nơ-ron lớn, Google cho biết các mô hình MoE có thể được chia nhỏ thành nhiều mạng nơ-ron “chuyên gia”. Bằng cách đó, chỉ những con đường cần thiết cho nhiệm vụ nhất định mới được kích hoạt trong mô hình mà Google cho biết là hiệu quả hơn nhiều so với chức năng tiêu chuẩn.

Phiên bản đầu tiên của Gemini 1.5 được cung cấp cho người thử nghiệm là Gemini 1.5 Pro. “Pro” là tên Google đặt cho LLM (mô hình ngôn ngữ lớn) hoạt động tốt nhất trên nhiều tác vụ và thiết bị nhất có thể. Hãy nghĩ về nó giống như GPT-3.5, mẫu được thiết kế để sử dụng trong nhiều ứng dụng nhất có thể, thay vì những ứng dụng mạnh nhất.

Mặc dù 1.5 Pro có cửa sổ ngữ cảnh 128.000 mã thông báo tiêu chuẩn (giống như GPT-4), Google cho biết họ hiện đang thử nghiệm cửa sổ ngữ cảnh lên tới một triệu mã thông báo, cũng như 10 triệu, so với 32.000 của 1.0 Pro. Một mô hình có thể chạy càng nhiều mã thông báo thì lời nhắc của bạn càng lớn và do đó, yêu cầu mà mô hình có thể xử lý cùng một lúc càng lớn. Theo Google, 1.5 Pro có thể xử lý tối đa một giờ video, 11 giờ âm thanh và cơ sở mã với hơn 30.000 dòng mã (hoặc hơn 700.000 từ) cùng một lúc. (Nó cũng có thể xử lý các lời nhắc đơn lẻ với hơn 100.000 dòng mã.)

1.5 Pro được cho là có khả năng hiểu lượng lớn thông tin tốt hơn và có thể trả lời các câu hỏi phức tạp và cụ thể về thông tin đó. Trong video demo, Google hiển thị ví dụ về cách cung cấp cho 1.5 Pro bản ghi 402 trang từ sứ mệnh Apollo 11. Sau đó, nó chia sẻ một bản phác thảo về một chiếc ủng đang đi bộ, với một mũi tên chỉ xuống đất và hỏi người mẫu hình ảnh này nói về điều gì. Người mẫu có thể xác định rằng bản phác thảo này mô tả khoảnh khắc Neil Armstrong bước lên mặt trăng và nói câu nói nổi tiếng của ông, tất cả đều từ bức vẽ. Nó cũng có thể phân tích nội dung giống như một bộ phim câm, mô tả những gì đã xảy ra và nêu bật những khoảnh khắc nhỏ mà hầu hết người xem có thể bỏ lỡ.

Google cho biết 1.5 Pro vượt trội hơn 1.0 Pro trên 87% điểm chuẩn thử nghiệm mà nó sử dụng. Nó cũng hoạt động “ở mức độ tương tự” với 1.0 Ultra, mô hình cung cấp năng lượng cho Gemini Advanced. Công ty cũng hài lòng với tính năng “học tập trong ngữ cảnh”, trong đó mô hình có thể lấy thông tin từ tập dữ liệu hiện tại và áp dụng nó theo những cách mới mà không cần thêm lời nhắc.

Cách dùng thử Gemini 1.5

Google đang chạy thử nghiệm Gemini 1.5 Pro thông qua AI Studio và Vertex AI, đồng thời có danh sách chờ dành cho các nhà phát triển quan tâm. Nếu bạn thực sự là một nhà phát triển quan tâm, bạn có thể đăng ký danh sách chờ tại đây.

Sau khi Gemini 1.5 được cung cấp rộng rãi thông qua các dịch vụ Gemini của Google, bạn sẽ có thể sử dụng miễn phí khoảng 125.000 mã thông báo của nó. Nếu bạn muốn truy cập vào cửa sổ một triệu mã thông báo, bạn sẽ phải trả phí. (Tại thời điểm này, giá vẫn chưa được biết.)



Mẹo vặt hay | Mẹo vặt cuộc sống | Kiến thức hằng ngày

Tin cùng loại

Trạm nối 13 trong 1 này hiện đang được bán với giá 40 đô l. a.

Mẹo Vặt

Microsoft muốn hiển thị cho bạn quảng cáo trong Menu Bắt đầu của Home windows 11

Mẹo Vặt

MacBook Air M1 giảm xuống còn 700 USD

Mẹo Vặt