Để máy tính có thể dự đoán chính xác, điều kiện tiên quyết là phải có nguồn dữ liệu đủ lớn, đa dạng và chất lượng. Các công ty công nghệ lớn như Google, Facebook, Amazon thu thập hàng tỷ điểm dữ liệu mỗi ngày từ người dùng và sử dụng chúng để huấn luyện