Amazon SageMaker Ground Truth giúp bạn xây dựng bộ dữ liệu đào tạo có độ chính xác cao để học máy một cách nhanh chóng. SageMaker Ground Truth cung cấp khả năng dễ dàng truy cập vào các nhà gắn nhãn công cộng và tư nhân, đồng thời cung cấp cho họ các giao diện và quy trình công việc tích hợp cho các tác vụ gắn nhãn thông thường. Ngoài ra, SageMaker Ground Truth có thể giảm tới 70% chi phí gắn nhãn của bạn bằng cách sử dụng tính năng gắn nhãn tự động, hoạt động bằng cách đào tạo Ground Truth từ dữ liệu do con người gắn nhãn để dịch vụ học cách gắn nhãn dữ liệu một cách độc lập.
Các mô hình học máy thành công được xây dựng dựa trên khối lượng lớn dữ liệu đào tạo chất lượng cao. Tuy nhiên, quá trình tạo dữ liệu đào tạo cần thiết để xây dựng các mô hình này thường tốn kém, phức tạp và tốn thời gian. Phần lớn các mô hình được tạo ngày nay yêu cầu con người gắn nhãn dữ liệu theo cách thủ công theo cách cho phép mô hình học cách đưa ra quyết định chính xác. Ví dụ: việc xây dựng một hệ thống thị giác máy tính đủ tin cậy để xác định các đối tượng – chẳng hạn như đèn giao thông, biển báo dừng và người đi bộ – cần hàng nghìn giờ quay video bao gồm hàng trăm triệu
khung hình video. Mỗi khung trong số này cần có tất cả các yếu tố quan trọng như đường, các xe khác và biển báo để con người dán nhãn trước khi bất kỳ công việc nào có thể bắt đầu trên mô hình bạn muốn phát triển.
Amazon SageMaker Ground Truth giúp giảm đáng kể thời gian và nỗ lực cần thiết để tạo bộ dữ liệu cho đào tạo nhằm giảm chi phí. Những khoản tiết kiệm này đạt được bằng cách sử dụng máy học để tự động ghi nhãn dữ liệu. Mô hình có thể ngày càng trở nên tốt hơn theo thời gian bằng cách liên tục học hỏi từ các nhãn được tạo ra bởi các nhà gắn nhãn con người.
Khi mô hình dán nhãn có mức độ tin cậy cao trong kết quả của nó dựa trên những gì nó đã học được cho đến nay, nó sẽ tự động áp dụng nhãn cho dữ liệu thô. Khi mô hình gắn nhãn có mức độ tin cậy thấp hơn trong kết quả của nó, nó sẽ chuyển dữ liệu cho con người để thực hiện việc gắn nhãn. Các nhãn do con người tạo ra được cung cấp trở lại mô hình dán nhãn để nó học hỏi và cải thiện. Theo thời gian, SageMaker Ground Truth có thể tự động gắn nhãn ngày càng nhiều dữ liệu và tăng tốc đáng kể việc tạo tập dữ liệu đào tạo.