Categories
Software Architecture

Phân tích AWS 3: Amazon EMR

Amazon EMR là nền tảng dữ liệu lớn đám mây hàng đầu trong ngành để xử lý lượng lớn dữ liệu bằng các công cụ nguồn mở như Apache Spark, Apache Hive, Apache HBase, Apache Flink, Apache HudiPresto. Amazon EMR giúp dễ dàng thiết lập, vận hành và mở rộng quy mô môi trường dữ liệu lớn của bạn bằng cách tự động hóa các tác vụ tốn thời gian như cung cấp dung lượng và các cụm điều chỉnh. Với EMR, bạn có thể chạy phân tích quy mô petabyte với chi phí thấp hơn một nửa so với các giải pháp tại chỗ truyền thống và
nhanh hơn gấp 3 lần so với Apache Spark tiêu chuẩn. Bạn có thể chạy khối lượng công việc trên các phiên bản Amazon EC2, trên các cụm Amazon Elastic Kubernetes Service (EKS) hoặc tại chỗ bằng cách sử dụng EMR trên AWS Outposts.

Leave a Reply

Your email address will not be published. Required fields are marked *