Máy học AWS 22: Amazon Transcribe

Amazon Transcribe là dịch vụ nhận dạng giọng nói tự động (ASR) giúp các nhà phát triển dễ dàng thêm khả năng chuyển giọng nói thành văn bản vào ứng dụng của họ. Sử dụng API phiên âm của Amazon, bạn có thể phân tích các tệp
âm thanh được lưu trữ trong Amazon S3 và yêu cầu dịch vụ trả lại tệp văn bản của bài phát biểu đã phiên âm. Bạn cũng có thể gửi luồng âm thanh trực tiếp tới Amazon Transcribe và nhận luồng bản ghi trong thời gian thực.

Amazon Transcribe có thể được sử dụng cho nhiều ứng dụng phổ biến, bao gồm phiên âm các cuộc gọi dịch vụ khách hàng và tạo phụ đề cho nội dung âm thanh và video. Dịch vụ có thể phiên âm các tệp âm thanh
được lưu trữ ở các định dạng phổ biến, như WAV và MP3, với dấu thời gian cho mỗi từ để bạn có thể dễ dàng định vị âm thanh trong nguồn gốc bằng cách tìm kiếm văn bản. Amazon Transcribe liên tục học hỏi và cải tiến để bắt kịp với sự phát triển của ngôn ngữ.

Leave a Reply Cancel reply