Theo Hindustantime Tech, cơ sở dữ liệu này chứa thông tin người dùng như tên, thông tin liên hệ, hình ảnh và số liệu thống kê về những người theo dõi (followers, subscribers) trên Instagram, TikTok và YouTube.
Tuy nhiên, nhiều công ty phân tích tạo ra cơ sở dữ liệu khổng lồ về thông tin người dùng bằng cách sử dụng trình duyệt web trên các trang web phổ biến và bán thông tin chi tiết thu thập được từ các cơ sở dữ liệu này cho các công ty khác.
Người phát ngôn của Social Data tuyên bố tất cả dữ liệu trên đều được công khai và không bị thu thập dưới bất kỳ hình thức đáng ngờ nào. Tuy nhiên, các công ty chủ quản YouTube, Instagram và TikTok vốn đều cấm các hoạt động “web scraping” từ lâu.
Dữ liệu cóp nhặt bị lộ gồm có bốn bộ dữ liệu chính với thông tin chi tiết về hàng triệu người dùng từ TikTok, Instagram và YouTube. Các thông tin này bao gồm tên hồ sơ, họ tên, ảnh hồ sơ, tuổi, giới tính và số liệu thống kê về những người theo dõi (follower, subscriber). Dữ liệu loại này thường được sử dụng cho các chiến dịch thư rác và lừa đảo.