Google trình làng loạt sản phẩm AI

Tại hội nghị thường niên Google I/O 2024 dành cho nhà phát triển diễn ra tối 14/5 (theo giờ Mỹ), Google giới thiệu loạt sản phẩm trí tuệ nhân tạo, từ các mô hình nhỏ chạy cục bộ cho đến mô hình ngôn ngữ lớn với hàng chục tỷ tham số.

Google trình làng loạt sản phẩm AI tại sự kiện Google I/O 2024.

Theo CNBC, phần lớn các tính năng hay công cụ Google giới thiệu tại sự kiện I/O 2024 mới chỉ ở giai đoạn thử nghiệm hoặc có sẵn cho lập trình viên.

Dưới đây là những sản phẩm nổi bật mà Google đã giới thiệu tại sự kiện I/O 2024:

Gemini được tích hợp trên hầu hết ứng dụng

Google công bố phiên bản AI Gemini 1.5 với hàng loạt tính năng mới gồm khả năng phân tích văn bản, code, video, đoạn ghi âm với thời lượng dài hơn trước. Hiện mô hình ngôn ngữ lớn này có nhiều phiên bản.

Gemini 1.5 Pro sẽ trở thành trợ lý đa năng trong Workspace, có thể lấy thông tin từ bất kỳ và tất cả nội dung từ Drive, viết e-mail kết hợp thông tin từ tài liệu đang xem. Hơn nữa, ở ứng dụng Gmail, Gemini 1.5 Pro sẽ phân tích PDF và video đính kèm để tóm tắt. Trong trường hợp người dùng bỏ lỡ luồng e-mail, Gemini có thể tóm tắt những nội dung chính giúp người dùng. Mô hình sẽ được đưa vào Google Docs, Sheets, Slides, Drive và Gmail tháng tới, nhưng trước mắt chỉ dành cho người dùng trả phí.

Gemini 1.5 Flash là mô hình đa phương thức mới và tối ưu hóa cho các tác vụ hẹp, tần suất cao, độ trễ thấp - yếu tố giúp các mô hình trí tuệ nhân tạo phản hồi nhanh. Mô hình này có thể trò chuyện với người dùng về mọi thứ được chụp bằng camera smartphone của người dùng theo thời gian thực, kết quả tìm kiếm sẽ được phân loại theo tiêu đề do trí tuệ nhân tạo tạo ra. Google chưa tiết lộ những sản phẩm nào sẽ được tích hợp mô hình này.

Gemini Live là tính năng mới giúp người dùng tương tác với smartphone thông qua sử dụng công nghệ giọng nói chuyên biệt, tự nhiên. Tại sự kiện, CEO Google Sundar Pichai hỏi mô hình này một câu đơn giản như "Tôi có một cuộc phỏng vấn xin việc làm pha chế nhưng tôi chưa làm bao giờ. Bạn có thể cho tôi một vài gợi ý không?". Gemini ngay lập tức đưa ra các gợi ý về cách chuẩn bị cho cuộc phỏng vấn này. Các gợi ý bao gồm những việc như xem video về cách pha chế một số đồ uống đơn giản và luyện tập pha chế chúng tại nhà trước. Cuộc trò chuyện diễn ra tự nhiên, giống như người dùng đang tương tác với người thật ở ngoài đời.

Một điểm ấn tượng khác là người dùng có thể ngắt lời Gemini giữa chừng để thêm hoặc thay đổi nội dung. Gemini sẽ điều chỉnh các đề xuất và cuộc trò chuyện cho phù hợp. Dự kiến, Gemini Live khả dụng cho những người đăng ký Gemini Advanced trong thời gian tới.

Gemini Nano là mô hình trí tuệ nhân tạo có kích thước nhỏ nhất, được tích hợp lên trình duyệt Chrome cho máy tính bàn từ phiên bản 126. Mô hình này cung cấp khả năng phiên âm giọng nói, tóm tắt cuộc hội thoại, dịch văn bản...

Gemini Nano được tích hợp trong trình duyệt Chrome, có khả năng tóm tắt cuộc hội thoại, dịch văn bản, phiên âm giọng nói...Ảnh: Theo Google.

Nhà phát triển Jon Dahlke cho biết, việc tích hợp Gemini Nano trực tiếp vào trình duyệt Chrome sẽ giúp ứng dụng truy cập trí tuệ nhân tạo tạo sinh nhanh và dễ dàng hơn mà không cần phải liên hệ với máy chủ.

Google cũng sẽ tích hợp Gemini lên Android, giúp người dùng tránh cuộc gọi lừa đảo bằng cách phát hiện các dấu hiệu nguy hiểm rồi đưa ra cảnh báo theo thời gian thực. Tính năng này sẽ được công bố chi tiết vào cuối năm nay.

Đặc biệt, Google sẽ tích hợp mô hình Gemini trên công cụ tìm kiếm Google Search. Bà Liz Reid, Trưởng bộ phận tìm kiếm của Google cho biết: "Tích hợp trí tuệ nhân tạo vào công cụ tìm kiếm giúp giảm bớt sự khó khăn của việc tìm kiếm. Điều này giúp người dùng tập trung vào những phần họ thực sự muốn hoặc khám phám thêm".

Google sử dụng trí tuệ nhân tạo tổng hợp để tổ chức các kết quả dựa trên chủ đề và những gì người dùng có thể thấy thú vị. Thay vì phải đặt ra nhiều câu hỏi về một chủ đề như tìm một phòng tập yoga ở gần, khả năng suy luận đa bước của Gemini giúp Google thực hiện các nghiên cứu nâng cao hơn thay cho người dùng, kết hợp cùng các yếu tố như vị trí, giờ làm việc và ưu đãi, để mang lại thông tin nhanh hơn.

Trên công cụ tìm kiếm, Google cũng đưa Gemini vào phục vụ khả năng sàng lọc ảnh, gọi là Ask Photos. Tính năng này cho phép nghiên cứu thư viện Google Photos, sau đó trả lời cho người dùng khi được yêu cầu.

CEO Google Sundar Pichai thử tính năng Ask Photo. Ảnh: Theo TechCrunch.

Chẳng hạn, CEO Sundar Pichai đã thử nghiệm tính năng bằng cách hỏi Gemini biển số xe của ông là gì. Câu trả lời là dãy số nhưng kèm một bức ảnh để ông chắc chắn rằng câu trả lời là đúng.

Google cũng đang triển khai một trình tạo chatbot tùy chỉnh có tên là Gems. Giống như mô hình GPT của OpenAI, Gems cho phép người dùng đưa ra hướng dẫn cho Gemini, từ đó tùy chỉnh cách phản hồi và chuyên môn của nó. Hiện tính năng chỉ dành cho tài khoản trả phí Gemini Advanced.

Google Veo, Imagen 3 và Audio Overviews

Google ra mắt mô hình tạo video Veo và Imagen 3. Đây được đánh giá là đối thủ mới của công cụ tạo video dựa trên văn bản Sora của ChatGPT.

Veo được xây dựng dựa trên 5 mô hình tạo video gồm Generative Query Network (GQN), DVD-GAN , Imagen-Video, Phenaki, WALT, VideoPoet và Lumiere, kết hợp với nhiều kỹ thuật khác để cải thiện chất lượng và độ phân giải đầu ra.

Mô hình này cũng hiểu các thuật ngữ điện ảnh như video timelapse, ảnh phong cảnh từ trên không, đồng thời có thể tạo ra cảnh nhất quán và mạch lạc, với các chủ thể con người, động vật và đồ vật chuyển động chân thực trong suốt cảnh quay.

Tại sự kiện, Google trình diễn video dài khoảng 8 giây. Tuy nhiên, công ty cho biết người dùng có thể đưa ra yêu cầu về việc kéo dài thời lượng lên 1 phút 10 giây, cũng như tinh chỉnh bằng lời nhắc bổ sung để thay đổi kết quả. Con số này cao hơn thời lượng tối đa 1 phút mà công cụ Sora của OpenAI công bố trước đó.

Một đoạn video do công cụ tạo video AI Veo tạo ra. Theo Google.

"Với khả năng hiểu ngôn ngữ tự nhiên và ngữ nghĩa hình ảnh tiên tiến, Veo tạo ra video phản ánh chặt chẽ tầm nhìn sáng tạo của người dùng - thể hiện chính xác giọng điệu của lời nhắc và hiển thị chi tiết trong các lời nhắc dài hơn," đại diện Google cho biết.

Ngoài ra, Google còn ra mắt công cụ tạo các đoạn thảo luận âm thanh dựa trên đầu vào văn bản Audio Overviews. Nếu người dùng tải kế hoạch học tập, chatbot có thể đọc tóm tắt nó. Trường hợp người dùng muốn hỏi cách xử lý một vấn đề trong cuộc sống, chatbot sẽ tương tác bằng âm thanh.

Tại sự kiện thường niên I/O 2024, Google cũng giới thiệu mô hình tạo ảnh Imagen 3 với cam kết hình ảnh chân thật, không giả tạo như các mô hình trước đó của hãng. Công cụ sẽ có sẵn với một số nhà sáng tạo được lựa chọn và cập bến Vertex AI, nền tảng máy học cho phép nhà phát triển đào tạo và triển khai ứng dụng trí tuệ nhân tạo.

Project Astra

Tại sự kiện, Google giới thiệu Astra - một AI đa phương thức do bộ phận DeepMind AI phát triển với mục tiêu trở thành trợ lý ảo "làm được mọi việc". Thông qua camera trên smartphone, Astra có thể xem và hiểu những gì nó nhìn thấy, ghi nhớ mọi thứ ở đâu và làm mọi việc cho người dùng.

Astra được xem là trợ lý AI đa phương thức, thời gian thực. Ảnh: Theo Google.

Trong video trình diễn tại I/O, trợ lý Astra giúp người dùng nhớ được họ để kính ở đâu, đánh giá các đoạn mã và trả lời câu hỏi về một phần trong bài thuyết trình của diễn giả. Google cho rằng một chatbot thực sự hữu dụng phải nói chuyện với người dùng một cách tự nhiên, không có độ trễ hay trì hoãn.

"Astra không chỉ nói chuyện với người dùng mà còn thực sự làm mọi việc thay bạn. Tuy nhiên giảm thời gian chờ là một thách thức lớn về mặt kỹ thuật," CEO DeepMind AI Demis Hassabis thông tin.

Google có kế hoạch đưa các tính năng của Project Astra vào ứng dụng Gemini và trên các sản phẩm của mình trong năm nay.

Project Astra nằm trong chuỗi thông báo của Google về tầm nhìn mới "Lấy trí tuệ nhân tạo làm trung tâm", trong bối cảnh các đối thủ lớn là Meta, Microsoft và OpenAI gần đây đã ra mắt nhiều sản phẩm và mô hình AI nâng cấp.

Gemma 2 với 27 tỷ tham số

Gemma 2 với 27 tỷ tham số, là bản nâng cấp lớn của Gemma trước đó. Phiên bản Gemma 2 đã được tối ưu để chạy trên GPU thế hệ tiếp theo của Nvidia, máy chủ Google Cloud TPU và dịch vụ Vertex AI.

Google giới thiệu bản nâng cấp Gemma 2. Ảnh: Theo Google.

Ông Josh Woodward, Phó chủ tịch Google Labs cho biết, Gemma 2 "mạnh gấp đôi" so với các mô hình nguồn mở như Llama của Meta và Mistral của Mistral AI. Gemma 2 sẽ được triển khai vào tháng 6 tới đây.

Đọc tiếp

Nhật Bản tài trợ hơn 28 triệu USD cho dự án quản lý đô thị thông minh tại Cần Thơ

Dự án “Hỗ trợ kỹ thuật, nâng cao năng lực quản lý đất đai phục vụ xây dựng thành phố Cần Thơ thành đô thị thông minh” có tổng mức đầu tư khoảng 29 triệu USD.

Apple phát hành phiên bản web của ứng dụng bản đồ

Apple vừa phát hành ứng dụng bản đồ (Apple Maps) trên các nền tảng website.

Huawei sắp ra mắt smartphone gập ba

Nhà sản xuất điện thoại Trung Quốc Huawei đang phát triển mẫu smartphone gập ba phần, dự kiến đi vào sản xuất hàng loạt vào cuối năm nay.

Malaysia và Singapore siết quản lý mạng xã hội, sàn thương mại điện tử

Malaysia và Singapore đang yêu cầu một số mạng xã hội, nền tảng nhắn tin và trang mua sắm điện tử phải đăng ký cấp phép mỗi năm và xác minh danh tính người dùng.

Meta phát hành mô hình AI mã nguồn mở mạnh nhất thế giới

Meta vừa phát hành Llama 3.1, phiên bản lớn nhất của mô hình trí tuệ nhân tạo Llama 3, chứa 405 tỷ tham số - mạnh nhất trên thế giới, Engadget đưa tin ngày 24/7.

Phát hiện hơn 90.000 lỗ hổng hệ thống tại Việt Nam

Các chuyên gia của Cục An toàn thông tin cho rằng, đối tượng tấn công có thể lợi dụng các lỗ hổng để tấn công, khai thác vào các hệ thống thông tin, máy chủ, máy trạm của các cơ quan, tổ chức tại Việt Nam.

Microsoft phát hành công cụ sửa lỗi sau sự cố toàn cầu

Microsoft vừa phát hành công cụ tạo USB khởi động giúp các quản trị viên sửa chữa những chiếc máy tính Windows đã bị ảnh hưởng bởi sự cố CrowdStrike Falcon vừa qua.

Apple tiến gần hơn đến iPhone màn hình gập

Apple vừa được cấp một bằng sáng chế mới, mô tả một thiết kế màn hình gập bền bỉ hơn, hé lộ khả năng iPhone Fold rất có thể sẽ sớm xuất hiện, theo PhoneArena.

Google hé lộ hình ảnh Pixel 9 Pro và 9 Pro Fold

Google vừa đăng tải video giới thiệu tiết lộ thiết kế của Pixel 9 Pro và Pixel 9 Pro Fold, dù sản phẩm chưa ra mắt chính thức.

Một hãng bay Việt Nam gặp gián đoạn vì sự cố của Microsoft

Sự cố liên quan đến hệ điều hành Windows mới đây của Microsoft khiến nhiều chuyến bay bị ảnh hưởng, trong đó có hãng hàng không Vietjet của Việt Nam.

OpenAI ra mắt mô hình AI nhỏ, rẻ hơn

OpenAI vừa ra mắt GPT-4o mini - phiên bản thu nhỏ của mô hình nhanh và mạnh nhất của hãng GPT-4o, đánh dấu một sự chuyển hướng đáng chú ý trong chiến lược phát triển của công ty.

BYD 'chào sân' thị trường Việt Nam với 3 mẫu xe

Ngày 18/7, hãng xe điện BYD của Trung Quốc ra mắt 3 mẫu xe tại thị trường Việt Nam gồm BYD Dolphin, BYD Atto 3 và BYD Seal.

Apple, Nvidia và Anthropic bị cáo buộc sử dụng trái phép dữ liệu YouTube

Apple, Nvidia và Anthropic đã sử dụng dữ liệu từ hơn 173.000 video trên YouTube để huấn luyện trí tuệ nhân tạo (AI) mà không xin phép.

Các ngân hàng Singapore sẽ loại bỏ xác thực bằng OTP

Các ngân hàng tại Singapore đang ráo riết loại bỏ hình thức xác thực sử dụng mật khẩu một lần (OTP) để đăng nhập tài khoản ngân hàng trong 3 tháng tới.

VinFast khai trương 3 cửa hàng đại lý đầu tiên tại Philippines

Ngày 16/7, VinFast chính thức khai trương đồng loạt 3 cửa hàng đại lý đầu tiên tại Philippines là: VinFast Aseana, VinFast EDSA và VinFast Alabang.

Bí mật nội bộ của Walt Disney bị rò rỉ vì tin tặc tấn công

Một nhóm tin tặc đã tung lên mạng hơn 1 terabyte dữ liệu nội bộ từ hơn 10.000 kênh nhắn tin và làm việc nhóm của công ty Walt Disney, Wall Street Journal đưa tin ngày 16/7.

Google sắp có thương vụ M&A lớn nhất lịch sử

Google đang tiến rất gần tới thỏa thuận mua lại một startup lĩnh vực an ninh mạng Wiz có trị giá lên tới 23 tỷ USD, Reuters đưa tin ngày 15/7.

Hơn 3 triệu tài khoản Vietcombank cập nhật sinh trắc học thành công

Sau 15 ngày triển khai Quyết định số 2345/QĐ-NHNN, Vietcombank ghi nhận 3 triệu khách hàng đã cập nhật thành công và 4 triệu giao dịch được thực hiện theo phương pháp sinh trắc học.

VinFast động thổ nhà máy lắp ráp xe điện tại Indonesia

Việc xây dựng nhà máy ở thị trường xe điện tiềm năng bậc nhất Đông Nam Á sẽ mang đến cơ hội việc làm cho lao động địa phương, khẳng định quyết tâm của VinFast trong chiến lược mở rộng tại thị trường khu vực và cam kết thúc đẩy ngành công nghiệp xe điện Indonesia.

Facebook, Instagram bỏ hạn chế với tài khoản ông Donald Trump

Tài khoản của cựu Tổng thống Mỹ Donald Trump trên các nền tảng Facebook, Instagram vừa được gỡ bỏ mọi hạn chế, trước thời điểm ông bị mưu sát trong cuộc vận động tranh cử tại Pennsylvania.

Apple phát cảnh báo khẩn tới người dùng iPhone

Một số dấu hiệu đáng ngờ mà người dùng nên chú ý gồm hiệu suất iPhone bị chậm bất thường hay các ứng dụng không cài đặt từ trước bỗng xuất hiện.

Samsung ra mắt Galaxy Z Fold 6 và Z Flip 6 'đấu' với Apple

Samsung vừa ra mắt hai mẫu smartphone cao cấp Galaxy Z Fold 6 và Galaxy Z Flip 6 với nhiều cải tiến, tính năng AI nhằm cạnh tranh trực tiếp với đối thủ Apple trong phân khúc cao cấp.

Hé lộ mẫu smartphone nắp gập Mix Flip của Xiaomi

Smartphone nắp gập Mix Flip của Xiaomi được nhận định là một trong những điện thoại gập mạnh nhất về cầu hình khi trang bị bộ vi xử lý Snapdragon 8 Gen 3.

Phát hiện chiêu lừa đảo chiếm Apple ID

PhoneArena dẫn báo cáo mới nhất của công ty bảo mật Symantec cho thấy, khoảng 1,46 tỷ người dùng iPhone trên toàn cầu đang đối mặt với một cuộc tấn công lừa đảo nhằm vào Apple ID để đánh cắp thông tin đăng nhập.

VinFast tham dự Triển lãm ô tô quốc tế Gaikindo Indonesia

Tại triển lãm ô tô quốc tế lớn nhất Indonesia này, khách hàng sẽ có cơ hội lái thử các mẫu VF 5 và VF e34 phiên bản tay lái nghịch của VinFast.

Ứng dụng cá độ bóng đá xuất hiện trái phép trên App Store

Lợi dụng mùa bóng đá Euro, các ứng dụng liên quan đến cá độ cờ bạc xuất hiện tràn lan trên kho ứng dụng App Store trong những ngày gần đây.

Australia 'bắt tay' Amazon xây trung tâm dữ liệu tuyệt mật

Australia sẽ chuyển dữ liệu tình báo tối mật lên các dịch vụ đám mây theo thỏa thuận trị giá 1,3 tỷ USD với Amazon Web Services.

Hà Nội chính thức vận hành hệ thống giao thông thông minh

Sáng 4/7, Sở Giao thông vận tải TP Hà Nội khai trương hệ thống Giao thông thông minh (ITS), ứng dụng kỹ thuật công nghệ vào tổ chức, quản lý điều hành giao thông đảm bảo an toàn, giảm thời gian và chi phí đi lại, bảo vệ môi trường.

Cách phân biệt hàng thật, hàng giả đối với hơn 400 sản phẩm thiết yếu

Từ ngày 3-7/7, Tổng cục Quản lý thị trường mở cửa phòng trưng bày nhận diện hàng thật - giả đối với hơn 400 sản phẩm nhằm trang bị kiến thức phân biệt hàng hóa thật - giả trên thị trường cho người tiêu dùng.

Người dùng gặp khó khi xác thực sinh trắc học trên ứng dụng ngân hàng

Theo quy định mới, mọi giao dịch chuyển tiền từ 10 triệu đồng trở lên đều phải thông qua bước xác thực bằng sinh trắc học đối với người chuyển tiền. Tuy nhiên, một số người gặp khó khăn trong việc xác thực vì ứng dụng ngân hàng liên tục báo lỗi.

Khách hàng tại Bắc Ninh mất hơn 26 tỷ đồng vì bị lừa đảo qua điện thoại

Ngày 2/7/2024, tòa án nhân dân tỉnh Bắc Ninh mở phiên tòa xét xử vụ kiện của khách hàng Trần Thị Chúc, bị lừa đảo và đánh cắp hơn 26 tỷ đồng trong 2 tài khoản tại 2 ngân hàng. Đây là một vụ việc điển hình về tội phạm công nghệ trên nền tảng thanh toán số, với chiêu bài giả mạo công an đe dọa nạn nhân liên quan đến đường dây buôn bán ma túy, rửa tiền.