Apple, Nvidia và Anthropic bị cáo buộc sử dụng trái phép dữ liệu YouTube

18/07/2024 10:57

Apple, Nvidia và Anthropic đã sử dụng dữ liệu từ hơn 173.000 video trên YouTube để huấn luyện trí tuệ nhân tạo (AI) mà không xin phép.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi,” Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Apple, Nvidia và Anthropic sử dụng trái phép dữ liệu YouTube để đào tạo AI.

YouTube là kho lưu trữ video lớn nhất thế giới, được xem là “mỏ vàng” dữ liệu để đào tạo AI, bao gồm bản ghi âm, âm thanh, video và hình ảnh. Trong một tuyên bố mới đây, CEO YouTube Neal Mohan cho rằng, nếu các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là đang vi phạm các điều khoản và dịch vụ của nền tảng này.

Hiện các công ty AI vẫn chưa minh bạch về dữ liệu được sử dụng để đào tạo thuật toán. Đầu tháng 7, các nghệ sỹ và nhiêpas ảnh gia đã lên tiêngs chỉ trích Apple vì không minh bạch nguồn dữ liệu đào tạo cho Apple Intelligence - tính năng AI mới sẽ có mặt trên hàng triệu thiết bị của hãng trong năm nay.

Hay như hồi đầu năm nay, Giám đốc công nghệ OpenAI Mira Murati đã né tránh các câu hỏi từ Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo công cụ tạo video AI Sora sắp ra mắt của hãng hay không.

“Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai,” bà Murati trả lời câu hỏi của Wall Street Journal.

Đọc tiếp

Thủ tướng Phạm Minh Chính dự Lễ khai mạc Techfest Việt Nam 2025

Tối 13/12, TechFest Việt Nam 2025 với chủ đề “Khởi nghiệp sáng tạo toàn dân – Động lực tăng trưởng mới” chính thức khai mạc.

Người dùng Sora có thể tạo video với các nhân vật của Disney từ năm 2026

Trong thông báo ngày 11/12, Disney sẽ đầu tư 1 tỷ USD vào OpenAI, cho phép người dùng tạo video với các nhân vật quen thuộc trong công cụ tạo video AI Sora.

Người dân có thể chia sẻ ý tưởng trên Cổng sáng kiến khoa học công nghệ quốc gia

Cổng sáng kiến khoa học và công nghệ quốc gia là một môi trường mở, cho phép mọi người dân chia sẻ ý tưởng, sáng kiến và được ghi nhận một cách minh bạch.

Hà Nội sắp đưa vào vận hành sàn giao dịch công nghệ

Thông tin trên được TS. Trần Anh Tuấn, Giám đốc Sở Khoa học và Công nghệ thành phố Hà Nội đưa ra tại Diễn đàn quản trị doanh nghiệp Việt Nam 2025, diễn ra chiều 10/12.

Quốc gia đầu tiên cấm trẻ em dưới 16 tuổi dùng mạng xã hội

Từ ngày 10/12, lệnh cấm mạng xã hội đối với người dùng dưới 16 tuổi tại Australia có hiệu lực, đánh dấu quy định pháp lý tiên phong trên thế giới nhằm bảo vệ trẻ em khỏi chứng nghiện điện thoại và các tác hại trực tuyến.

Vinfast bàn giao 23.186 ô tô điện trong tháng 11/2025

VinFast tiếp tục phá kỷ lục về số lượng xe bán ra, đồng thời khẳng định vững chắc vị thế dẫn đầu thị trường với tổng lũy kế lên đến 147.450 xe tính từ đầu năm.

Nhà mạng Việt đầu tiên 'về đích' sớm mục tiêu 20.000 trạm 5G

Viettel hoàn thành lắp đặt 20.000 trạm BTS 5G trong năm 2025, trở thành nhà mạng đầu tiên tại Việt Nam đạt số lượng này.

Tin công nghệ tuần qua: Samsung ra smartphone gập ba, K+ dừng phát sóng tại Việt Nam

Những thông tin công nghệ nổi bật trong tuần (từ ngày 1-7/12) gồm ByteDance ra mắt trợ lý AI mới, Samsung trình làng điện thoại gập ba Galaxy Z TriFold và thông báo K+ ngừng phát sóng từ năm 2026.

Robot hình người Optimus gây chú ý vì dáng chạy tự nhiên

Trong màn trình diễn mới đây, robot hình người Optimus của Tesla thể hiện bước tiến vượt trội khi chạy với tốc độ nhanh, ước tính khoảng 13,7 km/h.

Đến năm 2030, Việt Nam hoàn thành xây dựng Chính phủ số

Đến năm 2030, Việt Nam hoàn thành xây dựng Chính phủ số và hình thành Chính phủ thông minh, vận hành trên nền tảng dữ liệu lớn và trí tuệ nhân tạo, hướng tới quản trị chủ động.

Chuyên gia công nghệ nói gì về nguy cơ AI 'cướp' việc

Các chuyên gia công nghệ đưa ra những quan điểm khác nhau về tác động của trí tuệ nhân tạo (AI) đối với tương lai thị trường lao động.

'AI có thể thao túng tâm lý, hành vi của con người'

Theo các đại biểu Quốc hội, AI có thể thao túng tâm lý, hành vi, làm suy giảm tư duy cảm thụ, cảm nhận độc lập của con người.

Khai trương hệ thống quản lý các nhiệm vụ khoa học công nghệ theo thời gian thực

Ngày 27/11, Bộ Khoa học và Công nghệ khai trương hệ thống quản lý trực tuyến các nhiệm vụ khoa học và công nghệ theo thời gian thực.

Từ 1/7/2026, Hà Nội cấm xe máy xăng vào vùng phát thải thấp theo khung giờ

Hà Nội sẽ cấm mô tô, xe gắn máy khác lưu thông vào vùng phát thải thấp theo khung giờ/thời điểm hoặc khu vực trong vành đai 1 từ ngày 1/7/2026.

Chuyên gia 'hiến kế' phát triển các ngành công nghệ chiến lược của Việt Nam

Ngày 26/11, Phó Thủ tướng Nguyễn Chí Dũng chủ trì chương trình làm việc với Mạng lưới đổi mới sáng tạo và chuyên gia Việt Nam về các ngành công nghệ chiến lược.

Thị trường xe máy điện: Đa dạng những lựa chọn theo tầm giá

Thời gian gần đây, thị trường xe máy điện tại Việt Nam nở rộ với nhiều thương hiệu cả trong và ngoài nước. Người tiêu dùng đang có nhiều lựa chọn phù hợp với nhu cầu sử dụng, mẫu mã, kiểu dáng và mức giá.

Tràn lan những hình ảnh, video dùng AI giả mạo về mưa lũ miền Trung

Những ngày qua, hàng loạt hình ảnh và video giả mạo bằng AI về mưa lũ miền Trung lan truyền trên mạng xã hội, nhằm trục lợi và gây hoang mang dư luận.

Tin công nghệ tuần qua: iPhone sắp có ốp lưng cảm ứng, Vivo X300 Series về Việt Nam

Những thông tin công nghệ nổi bật trong tuần (từ ngày 17-23/11) gồm Google ra mắt mô hình AI Gemini 3, iPhone sắp có ốp lưng tích hợp cảm ứng, Vivo giới thiệu dòng X300 Series tại Việt Nam.

Khách Việt chia sẻ về những giá trị 'tốt gỗ tốt cả nước sơn' của VinFast VF 7

VinFast VF 7 được đánh giá cao với thiết kế cuốn hút, cảm giác lái phấn khích và loạt tính năng an toàn hoạt động xuất sắc ngay cả trong điều kiện khắc nghiệt.

Thái Nguyên: Tiếp cận thông tin giúp Định Hóa giảm nghèo hiệu quả

Xã Định Hóa, tỉnh Thái Nguyên, đã triển khai nhiều giải pháp mở rộng tiếp cận thông tin, giúp người dân nâng cao nhận thức và chủ động vươn lên thoát nghèo.

Gia Phù phát huy vai trò thông tin trong hành trình giảm nghèo bền vững

Xã Gia Phù (tỉnh Sơn La) tăng cường truyền thông, mở rộng hạ tầng số và hỗ trợ kỹ năng công nghệ nhằm giúp hộ nghèo, cận nghèo tiếp cận thông tin, nâng cao năng lực và thoát nghèo bền vững.

An Giang: Tăng cường công tác giảm nghèo về thông tin tại vùng biên giới

Tỉnh An Giang đặt mục tiêu giảm nghèo bền vững với tỷ lệ hộ nghèo 0,91%, hộ cận nghèo 2%, đồng thời tăng cường triển khai các dự án “giảm nghèo về thông tin” tại vùng biên giới

Phủ Thông đổi mới tuyên truyền, đưa giảm nghèo thông tin đi vào thực chất

Những năm gần đây, xã Phủ Thông, tỉnh Thái Nguyên, đã triển khai nhiều hình thức tuyên truyền đa dạng, sát với nhu cầu thực tế của người dân, giúp họ tiếp cận thông tin sinh động và dần hình thành thói quen học hỏi, áp dụng tiến bộ kỹ thuật vào sản xuất.