Theo CNBC, nhiều tính năng hay công cụ mà Google giới thiệu mới ở trong giai đoạn thử nghiệm hoặc có sẵn cho lập trình viên. Tuy nhiên, chúng giúp hình dung về cách tiếp cận của gã khổng lồ tìm kiếm trong lĩnh vực AI.
CEO Google Sundar Pichai trên sân khấu sự kiện I/O 2024 |
Google kiếm tiền từ trí tuệ nhân tạo (AI) bằng cách thu phí những nhà phát triển sử dụng mô hình của hãng và từ khách hàng, những người trả 19,99 USD/tháng cho chatbot Gemini Advanced để tóm tắt các tập tin PDF, Google Docs.
Sau đây là những thứ mà Google đã mang đến I/O 2024:
Gemini AI
Google giới thiệu mô hình AI Gemini 1.5 Pro mới với khả năng xử lý nhiều dữ liệu hơn Chẳng hạn, công cụ có thể tổng hợp được 1.500 trang văn bản do người dùng tải lên. Bên cạnh đó, còn có mô hình Gemini 1.5 Flash AI mới, giúp tiết kiệm chi phí hơn và thiết kế để phục vụ những tác vụ đơn giản như tóm tắt nhanh đoạn hội thoại, ghi chú ảnh, video cũng như lấy dữ liệu từ các tài liệu lớn.
CEO của Google Sundar Pichai nhấn mạnh những cải tiến trong khả năng dịch thuật của Gemini và cho biết nó sẽ có sẵn cho tất cả lập trình viên trên toàn cầu với 35 ngôn ngữ khác nhau. Bên trong Gmail, Gemini 1.5 Pro sẽ phân tích PDF cùng video đính kèm để tóm tắt.
Theo Google, Gemini thậm chí có thể thay thế cả Google Assistant trên điện thoại Android và gợi ý nó còn mạnh mẽ hơn cả Siri trên iPhone.
Google Veo, Imagen 3 cùng Audio Overviews
Google vừa giới thiệu loạt mô hình tạo ảnh và video để cạnh tranh OpenAI như: Veo, mô hình tạo video HD cùng Imagen 3, mô hình tạo ảnh tại I/O 2024 với cam kết tạo ra hình ảnh chân thật, không giả tạo như những mô hình trước đó của hãng. Công cụ sẽ có sẵn cho một số nhà sáng tạo được lựa chọn và cập bến Vertex AI, nền tảng máy học cho phép các nhà phát triển đào tạo và triển khai ứng dụng AI.
Google Veo sẽ là đối thủ của Sora trong cuộc đua AI tạo video |
Ngoài ra, Google còn trình diễn Audio Overviews, công cụ tạo ra những đoạn thảo luận âm thanh dựa trên đầu vào văn bản. Chẳng hạn, nếu như người dùng tải kế hoạch học tập, chatbot có thể đọc tóm tắt nó. Hoặc, nếu hỏi cách xử lý một vấn đề nào đó trong cuộc sống, nó sẽ tương tác bằng âm thanh.
Gã khổng lồ tìm kiếm cũng mang đến AI Sandbox, một loạt công cụ AI tạo sinh để sáng tác nhạc cùng âm thanh từ đầu dựa trên lời nhắc của người dùng.
Tính năng tìm kiếm mới
Tại thị trường Mỹ, người dùng có thể sử dụng tính năng AI Overviews trên Google Search từ đầu tuần sau. Theo Liz Reid, Giám đốc Google Search cho biết tính năng mới sẽ giúp tóm tắt nhanh nhưng câu trả lời cho những câu hỏi tìm kiếm phức tạp nhất.
Google dự định giới thiệu những tính năng lập kế hoạch ngay trong tìm kiếm. Trong thời gian tới, công ty cũng sẽ thử nghiệm tính năng đặt câu hỏi qua video như quay phim lại sự cố gặp phải, tải lên rồi hỏi Google.
Một tính năng khác cũng đang được Google thử nghiệm là AI Teammate, tích hợp trong Google Workspace. Nó sẽ tóm tắt lại dựa vào thông tin tập hợp trong Gmail, Google Docs và những ứng dụng Workspace khác.
Project Astra
Trong video demo trình diễn tại I/O, trợ lý Project Astra giúp người dùng nhớ được họ để kính ở đâu, đánh giá những đoạn mã cũng như trả lời câu hỏi về một phần trong bài thuyết trình của diễn giả.
Google cho rằng một chatbot thực sự hữu dụng sẽ phải nói chuyện với người dùng một cách tự nhiên, không có độ trễ hay trì hoãn. CEO DeepMind Demis Hassabis thừa nhận giảm thời gian chờ là một “thách thức kỹ thuật”.
Phần cứng AI
Google cũng công bố Trillium, bộ xử lý tensor (TPU) thế hệ 6 tại I/O 2024. Đây là phần cứng quan trọng để vận hành AI phức tạp và dự kiến được bán cho những khách hàng đám mây từ cuối năm nay.