Business

AI đang học từ những gì bạn nói trên Reddit, Stack Overflow hoặc Facebook. Bạn có ổn không?

CAMBRIDGE, Mass. (AP) - Đăng bình luận trên Reddit, trả lời các câu hỏi về lập trình trên Stack Overflow, chỉnh sửa một bài viết trên Wikipedia hoặc chia sẻ hình ảnh bé trên dòng thời gian công khai trên Facebook hoặc Instagram của bạn và bạn cũng đang giúp đào tạo thế hệ trí tuệ nhân tạo tiếp theo.

Không phải ai cũng ổn với điều đó - đặc biệt là khi những diễn đàn trực tuyến cùng nơi mà họ đã dành nhiều năm để đóng góp ngày càng bị ngập lụt bằng những bình luận được tạo ra bởi trí tuệ nhân tạo, giả mạo những gì mà con người thực sự có thể nói.

Một số người dùng lâu năm đã cố gắng xóa các đóng góp quá khứ của họ hoặc viết chúng thành lờ mờ, nhưng các cuộc biểu tình không có nhiều tác dụng. Một số chính phủ - bao gồm cơ quan bảo vệ quyền riêng tư của Brazil vào thứ Ba - cũng đã cố gắng can thiệp.

“Một phần lớn dân số chỉ cảm thấy bất lực,” nói các nhà tự do tình nguyện trên Reddit Sarah Gilbert, người cũng nghiên cứu cộng đồng trực tuyến tại Đại học Cornell. “Không có nơi để đi ngoại trừ hoàn toàn đóng cửa trực tuyến hoặc không đóng góp bằng cách mang lại giá trị cho họ và giá trị cho người khác.”

Các nền tảng đang phản ứng - với kết quả không đồng đều. Hãy lấy ví dụ Stack Overflow, nơi giao lưu phổ biến để chia sẻ mẹo lập trình máy tính. Ban đầu, họ đã cấm việc ghi nhận câu trả lời được viết bởi ChatGPT do lỗi thường xuyên, nhưng hiện nay họ đang hợp tác với các nhà phát triển chatbot AI và đã trừng phạt một số người dùng của chính họ đã cố gắng xóa các đóng góp quá khứ của họ trong cuộc biểu tình.

Đó là một trong số nhiều nền tảng mạng xã hội đang lúng túng với sự lo lắng của người dùng - và đôi khi cả cuộc nổi loạn - khi họ cố gắng thích ứng với những thay đổi mang lại bởi trí tuệ nhân tạo sinh sản.

Nhà phát triển phần mềm Andy Rotering của Bloomington, Minnesota, đã sử dụng Stack Overflow hàng ngày trong 15 năm và nói rằng anh lo lắng rằng công ty “có thể vô tình làm tổn thương tài nguyên quý nhất” - cộng đồng những người đóng góp đã dành thời gian để giúp đỡ các lập trình viên khác.

“Giữ cho những người đóng góp được khích lệ để cung cấp bình luận nên được xem là quan trọng nhất,” anh nói.

Giám đốc điều hành Stack Overflow Prashanth Chandrasekar nói rằng công ty đang cố gắng cân bằng nhu cầu tăng vọng chatbot trả lời viết code ngay lập tức với mong muốn có một “cơ sở kiến thức” cộng đồng nơi mọi người vẫn muốn đăng tải và “được công nhận” vì những gì họ đã đóng góp.

“Trong vòng năm năm tới - sẽ có đủ loại nội dung được tạo ra bởi máy trên web,” anh nói trong một cuộc phỏng vấn. “Sẽ có rất ít nơi nơi có suy nghĩ ban đầu, con người thực sự. Và chúng tôi là một trong những nơi đó.”

Chandrasekar đưa ra mô tả về những thách thức của Stack Overflow tương tự như một trong những “trường hợp điều tra” mà anh học được tại Harvard Business School, về cách một doanh nghiệp sống sót - hoặc không - sau một cuộc thay đổi công nghệ gây chấn động.

Trong hơn một thập kỷ, người dùng thường đến Stack Overflow sau khi gõ một câu hỏi về code trên Google, và sau đó tìm thấy câu trả lời, sao chép và dán. Câu trả lời mà họ có thể thấy nhiều nhất đến từ những người tình nguyện đã tích lũy điểm đánh giá sự đáng tin cậy của họ - có thể giúp họ tìm được công việc.

Bây giờ lập trình viên có thể đơn giản chỉ cần hỏi một chatbot AI - mà một số trong số đó đã được đào tạo với mọi thứ từng được đăng trên Stack Overflow - và nó có thể ngay lập tức đưa ra câu trả lời.

Ra mắt của ChatGPT vào cuối năm 2022 đe dọa đưa Stack Overflow vào tình trạng phá sản. Vì vậy Chandrasekar đã thành lập một nhóm đặc biệt 40 người tại công ty để nhanh chóng ra mắt chatbot AI chuyên nghiệp riêng, được gọi là Overflow AI. Sau đó, công ty đã ký kết thỏa thuận với Google và nhà sản xuất ChatGPT OpenAI, cho phép những nhà phát triển AI tiếp cận vào bộ lưu trữ câu hỏi và câu trả lời của Stack Overflow để cải thiện thêm các mô hình ngôn ngữ lớn của họ.

Chiến lược đó là hợp lý nhưng có thể đã đến quá muộn, nói Maria Roche, giáo sư trợ giảng tại Trường kinh doanh Harvard. “Tôi ngạc nhiên vì Stack Overflow không làm việc này sớm hơn,” cô nói.

Khi một số người dùng Stack Overflow đã cố gắng xóa những bình luận quá khứ của họ sau khi đối tác Open AI được thông báo, công ty đã phản ứng bằng cách đình chỉ tài khoản của họ vì các điều khoản khiến mọi đóng góp “vĩnh viễn và không thể thu hồi được cấp quyền sử dụng cho Stack Overflow.”

“Chúng tôi nhanh chóng giải quyết vấn đề đó và nói rằng, ‘Hãy nhìn, hành vi đó không chấp nhận,’” Chandrasekar nói, mô tả những người biểu tình là một nhóm thiểu số trong “vài trăm” người dùng của nền tảng có 100 triệu người dùng.

Cơ quan bảo vệ dữ liệu quốc gia của Brazil vào thứ Ba đã tiến hành hành động để cấm khỏi lớn truyền thông xã hội Meta Platforms từ việc đào tạo mô hình trí tuệ nhân tạo của mình trên các bài đăng Facebook và Instagram của người Brazil. Họ thiết lập một khoản phạt hàng ngày là 50.000 reais ($8.820) cho việc không tuân thủ.

Meta trong một tuyên bố gọi đó là một “bước lùi về phía đổi mới” và nói rằng họ đã minh bạch hơn nhiều so với nhiều đối thủ ngành đang đào tạo AI tương tự trên nội dung công cộng, và các phương pháp của họ tuân thủ pháp luật Brazil.

Meta cũng đã gặp kháng cự ở châu Âu, nơi họ gần đây đã tạm ngừng kế hoạch bắt đầu đưa các bài viết công cộng của mọi người vào việc đào tạo hệ thống AI - điều này dự kiến ​​bắt đầu vào tuần trước. Ở Mỹ, nơi không có luật quốc gia bảo vệ quyền riêng tư trực tuyến, việc đào tạo như vậy có thể đã diễn ra.

“Đa số người không có ý kiến ​​gì về việc dữ liệu của họ đang được sử dụng,” Gilbert nói.

Reddit đã thực hiện một cách tiếp cận khác - hợp tác với các nhà phát triển AI như OpenAI và Google trong khi cũng làm rõ rằng nội dung không thể được lấy một cách toàn bộ mà không có sự chấp thuận của nền tảng bởi các thực thể thương mại “mà không quan tâm đến quyền lợi hoặc quyền riêng tư của người dùng.” Các thỏa thuận đã giúp đầu tư Reddit những khoản tiền cần thiết để ra ​​mắt trên Wall Street vào tháng 3, với các nhà đầu tư đẩy giá trị của công ty lên gần 9 tỷ đô la chỉ vài giây sau khi nó bắt đầu được giao dịch trên Sở giao dịch chứng khoán New York.

Reddit không cố gắng trừng phạt người dùng đã biểu tình - cũng không thể dễ dàng làm như vậy vì Quản trị viên tự nguyện có quyền nhiều trong việc quyết định điều gì xảy ra trong các diễn đàn chuyên môn của họ được biết đến là các diễn đàn con gọi là subreddits. Nhưng điều lo lắng Gilbert, người giúp can thiệp vào diễn đàn “AskHistorians”, là sự phồng phộ ngày càng nhiều của bình luận được tạo ra bởi trí tuệ nhân tạo mà các quản trị viên phải quyết định liệu có nên cho phép hoặc cấm.

“Mọi người đến với Reddit vì họ muốn nói chuyện với mọi người, họ không muốn nói chuyện với bot,” Gilbert nói. “Có các ứng dụng mà họ có thể nói chuyện với bot nếu họ muốn. Nhưng lịch sử, Reddit đã được sử dụng để kết nối con người.”

Cô nói đó là một sự trớ trêu khi nội dung được tạo ra bởi AI đang đe dọa Reddit đã được lấy từ những bình luận của triệu người Redditors, và “có một rủi ro thực sự rằng sau này nó có thể đẩy mọi người ra khỏi.”

——

Phóng viên Đại học là Eléonore Hughes ở Rio de Janeiro đã đóng góp vào bài báo cáo này.

——

The Associated Press và OpenAI có một thỏa thuận cấp phép và công nghệ cho phép OpenAI truy cập vào một phần của lưu trữ văn bản AP.

Related Articles

Back to top button Back to top button