3.2. Phân tích dữ liệu lớnTransformers gồm hai phần chính: Encoder và Decoder.Encoder: Bao gồm nhiều lớp encoder, mỗi lớp gồm hai thành phần chính: cơ chế multi-head self-attention và mạng feed-forward. Encoder nhận đầu vào là chuỗi từ đã được mã hóa th