Internet

OpenAI ký thỏa thuận đào tạo AI trên dữ liệu Reddit

OpenAI đã ký kết thỏa thuận với Reddit để sử dụng dữ liệu của trang mạng xã hội để đào tạo các mô hình AI.

Trong một bài đăng trên trang thông cáo báo chí của OpenAI, công ty cho biết đối tác Reddit sẽ cung cấp cho họ quyền truy cập vào "nội dung thời gian thực, cấu trúc và độc đáo" - ví dụ như bài đăng và trả lời - từ Reddit, cho phép công cụ và mô hình của họ "hỗ trợ tốt hơn và trình bày" nội dung đó. Nội dung của Reddit sẽ được tích hợp vào ChatGPT, công cụ AI trò chuyện phổ biến của OpenAI, và hai công ty sẽ cùng nhau phát triển các "tính năng dựa trên AI" mới không xác định cho cả người dùng và quản trị viên Reddit.

OpenAI cũng sẽ trở thành đối tác quảng cáo của Reddit.

“Reddit sẽ dựa vào nền tảng mô hình AI của OpenAI để mang tầm nhìn mạnh mẽ của mình trở thành hiện thực,” OpenAI viết trong bài đăng. “Sử dụng LLMs, ML và AI cho phép Reddit cải thiện trải nghiệm người dùng cho tất cả mọi người.”

OpenAI có một số thỏa thuận cấp phép tương tự với các nhà cung cấp nội dung từ thư viện phương tiện truyền thông đến các tờ báo. Nhưng góc nhìn không bình thường của thỏa thuận này là Sam Altman, CEO của OpenAI, sở hữu 8,7% cổ phần trong Reddit, biến ông trở thành cổ đông lớn thứ ba, và trước đây là một thành viên của hội đồng quản trị của công ty.

Trong một nỗ lực để ngăn chặn sự xem xét, OpenAI nói trong báo cáo báo chí rằng, trong khi Altman vẫn là cổ đông Reddit, thỏa thuận “được dẫn dắt bởi Giám đốc điều hành của OpenAI [Brad Lightcap]” và “được phê duyệt bởi Ban Giám đốc độc lập của [OpenAI].” (Tôi muốn lưu ý ở đây rằng Altman là một thành viên của Hội đồng Quản trị của OpenAI; tuy nhiên, một người phát ngôn của OpenAI cho biết ông đã rút lui khỏi quyết định này.)

Reddit đã biến thỏa thuận cấp phép dữ liệu trở thành một phần quan trọng ngày càng tăng của chiến lược phát triển của mình khi dẫn đường trên thị trường làm công ty công cộng.

Trong tài liệu mô tả ghi công ty số 1, Reddit tiết lộ rằng họ có các thỏa thuận hợp đồng để cấp phép dữ liệu cho khách hàng bao gồm Google trị giá hơn 200 triệu đô la. Và trong báo cáo thu nhập đầu tiên của mình sau khi trở thành công ty công cộng, Reddit báo cáo tăng 450% so với cùng kỳ năm trước với doanh thu không phải từ quảng cáo chủ yếu là nhờ những thỏa thuận đó.

Giá cổ phiếu Reddit tăng 11% trong giao dịch ngoài giờ sau thông báo về thỏa thuận với OpenAI.

“Mâu thuẫn mà tôi nhìn thấy là, khi càng nhiều nội dung trên internet được viết bởi máy móc, thì người ta càng tăng giá trên nội dung từ con người thực sự,” CEO Reddit Steve Huffman nói trong cuộc gọi doanh thu của công ty vào tháng Ba. “Và chúng tôi có gần hai thập kỷ của cuộc trò chuyện chân thực.”

Nền tảng của Reddit - với hơn 1 tỉ bài đăng và hơn 16 tỉ bình luận, con số này tăng mỗi ngày nhờ hàng trăm triệu người dùng hoạt động - là một kho báu cho các công ty AI tạo sinh, mô hình học từ các ví dụ về nội dung, như văn bản và hình ảnh, để tạo ra nội dung mới, tương tự.

Nhưng công ty có thể phải đối mặt với sự phản đối từ phía người dùng quan tâm đến cách họ đang thương mại hóa dữ liệu của mình.

Có ý kiến cho rằng, cần xem xét cách Stack Overflow, diễn đàn Q&A dành cho nhà phát triển phần mềm, vừa mới đạt thỏa thuận với OpenAI để cung cấp dữ liệu cho việc đào tạo mô hình của họ. Để phản đối, một số người dùng đã xóa các câu trả lời được đánh giá cao về câu hỏi trên cộng đồng. Nhưng Stack Overflow đã khôi phục lại những bài đăng bị xóa và cấm người dùng đó, tuyên bố rằng họ không tuân thủ các điều khoản dịch vụ của mình.

Reddit đã thể hiện sự không hài lòng của mình với một nỗ lực để cung cấp cho người dùng Reddit quyền kiểm soát lớn hơn đối với dữ liệu cá nhân của họ.

Vana, một startup dựa trên blockchain, đưa ra nỗ lực để thúc đẩy một "DAO" dữ liệu (Tổ chức Tự trị Kỹ thuật Số) để cho phép người dùng Reddit gom dữ liệu của họ và quyết định cùng nhau cách sử dụng (hoặc bán) dữ liệu kết hợp đó. Reddit đã cấm subreddit của Vana dành cho thảo luận về DAO, trong một tuyên bố cho TechCrunch, và buộc tội công ty đang "lợi dụng" quyền kiểm soát xuất dữ liệu của mình.

Chúng tôi đang khởi động một bản tin thông tin AI! Đăng ký tại đây để bắt đầu nhận nó trong hộp thư của bạn vào ngày 5 tháng 6.

Related Articles

Back to top button Back to top button