Categories
Software Architecture

Kết Nối Ứng Dụng Của Bạn Với Dữ Liệu Azure 5: Kho Lưu Trữ Azure

Kho lưu trữ Azure

Azure Storage là một trong những dịch vụ đáng tin cậy và hiệu quả nhất trong Azure. Azure Storage cung cấp năm loại lưu trữ đều được hưởng lợi từ các tính năng được chia sẻ sau:

  • Dự phòng địa lý (Geo-redundancy), sao chép dữ liệu sang các trung tâm dữ liệu khác nhau để bạn có thể khôi phục nó nếu thảm họa khiến một trung tâm dữ liệu riêng lẻ bị lỗi
  • Mã hóa dữ liệu trong thời gian chạy
  • Miền tùy chỉnh

Năm kiểu lưu trữ Azure là Blob, Table, Queue, File và Disk (Hình 2-1):

Hình 2-1: Các loại lưu trữ trong Azure.

Hình 2-1: Các loại lưu trữ trong Azure

Lưu trữ các trang web tĩnh trên Azure Storage

Một tính năng thú vị khác của Azure Storage là lưu trữ trang web tĩnh. Tính năng trang web tĩnh này chỉ sử dụng lưu trữ Blob làm kho dữ liệu của nó và bạn có thể sử dụng nó để lưu trữ một trang web tĩnh trên Azure Storage. Tất cả những gì bạn phải làm để trang web của bạn chạy là tải các tệp của trang web tĩnh của bạn lên bộ nhớ Blob và cho biết tệp nào là tài liệu mặc định (chẳng hạn như index.html) và tệp nào là tài liệu lỗi (chẳng hạn như 404. html). Trang web của bạn sẽ chạy nhanh chóng với rất ít chi phí — trên thực tế, bạn chỉ trả tiền cho dung lượng bạn sử dụng và tính năng trang web tĩnh không mất thêm bất kỳ khoản phí nào. Ngoài ra, khi bạn sử dụng dự phòng địa lý (được bật theo mặc định), trang web của bạn sẽ hoạt động ngay cả khi trung tâm dữ liệu chính của bạn bị lỗi.

Lưu trữ Blob

Bộ lưu trữ Azure Blob lưu trữ dữ liệu lớn, không có cấu trúc — nghĩa đen là các đốm dữ liệu. Dữ liệu này có thể là video, hình ảnh, âm thanh, văn bản hoặc thậm chí là các tệp ổ cứng ảo (VHD) cho máy ảo.

Có ba loại Blobs: Trang, Block và Nối Blobs. Các khối trang được tối ưu hóa cho các hoạt động đọc và ghi ngẫu nhiên và hoàn hảo để lưu trữ VHD.

Block Blobs được tối ưu hóa để tải lên một cách hiệu quả lượng lớn dữ liệu. Chúng hoàn hảo để lưu trữ các tệp video lớn không thay đổi thường xuyên.

Nối Blobs được tối ưu hóa cho hoạt động nối thêm, chẳng hạn như lưu trữ nhật ký hoạt động không thể cập nhật hoặc xóa.

Bắt đầu với bộ nhớ Azure Blob

Lưu trữ bảng

Lưu trữ Azure Table là một kho lưu trữ khóa-giá trị NoSQL cực kỳ nhanh, rẻ mà bạn có thể sử dụng để lưu trữ dữ liệu trong các bảng linh hoạt. Một bảng có thể chứa một hàng mô tả đơn đặt hàng và một hàng khác mô tả thông tin khách hàng. Bạn không cần xác định lược đồ dữ liệu, làm cho việc lưu trữ Bảng rất linh hoạt.

Bắt đầu với bộ nhớ Azure Table

Lưu trữ hàng đợi

Lưu trữ hàng đợi Azure là một loại lưu trữ bất thường. Mặc dù nó được sử dụng để lưu trữ các thông điệp dữ liệu nhỏ, nhưng mục đích chính của nó là phục vụ như một hàng đợi. Bạn đặt thư vào hàng đợi và các quy trình khác sẽ nhận chúng. Mẫu này tách người gửi tin nhắn khỏi trình xử lý tin nhắn, dẫn đến các lợi ích về hiệu suất và độ tin cậy. Bộ nhớ hàng đợi được tìm thấy trong các phiên bản Windows trước.

Bắt đầu với bộ nhớ hàng đợi

Lưu trữ tập tin

Bạn có thể sử dụng bộ lưu trữ Tệp Azure làm ổ đĩa để chia sẻ tệp. Nó sử dụng giao thức Server Message Block (SMB), có nghĩa là bạn có thể sử dụng nó với Windows và Linux và truy cập nó từ đám mây hoặc hệ thống tại chỗ. Giống như các dịch vụ khác trong Azure Storage, Lưu trữ tệp có thể mở rộng và không tốn kém.

Bắt đầu với lưu trữ tệp Azure

Ổ đĩa lưu trữ

Lưu trữ Azure Disk tương tự như lưu trữ Tệp nhưng dành riêng cho hiệu suất I / O cao. Ví dụ, nó hoàn hảo để sử dụng làm ổ đĩa trong máy ảo yêu cầu hiệu suất cao để chạy SQL Server. Bộ nhớ đĩa chỉ có sẵn trong mức giá cao cấp của Azure Storage.

Lưu trữ hồ dữ liệu Azure

Các kho lưu trữ dữ liệu trước đây nhằm mục đích sử dụng ứng dụng thông thường hoặc sử dụng với máy ảo. Mặt khác, Azure Data Lake Storage là nơi lưu trữ cho các ứng dụng dữ liệu lớn. Nó cung cấp chức năng hồ dữ liệu an toàn, có khả năng mở rộng lớn được xây dựng trên bộ lưu trữ Azure Blob. Bạn có thể sử dụng nó để lưu trữ một lượng lớn dữ liệu ở định dạng gốc — có cấu trúc, không có cấu trúc hoặc bất kỳ thứ gì ở giữa. Mục đích của Data Lake Storage là lưu giữ dữ liệu thô của bạn để bạn có thể phân tích nó hoặc chuyển đổi và di chuyển nó.

Sau đây là các đặc điểm chính của Azure Data Lake Storage:

  • Không giới hạn dung lượng lưu trữ. Một tệp có thể có kích thước lớn hơn một petabyte — lớn hơn 200 lần so với những gì các nhà cung cấp dịch vụ đám mây khác cung cấp.
  • Hiệu suất có thể mở rộng để đáp ứng các phân tích song song lớn.
  • Dữ liệu có thể được lưu trữ ở bất kỳ định dạng nào, không cần giản đồ.

Đây là một cách tiếp cận rất khác so với kho dữ liệu truyền thống, trong đó bạn xác định trước các lược đồ dữ liệu.

Bạn có thể lưu trữ tất cả dữ liệu nhận được từ các thiết bị Internet of Things (IoT) (ví dụ: thu thập dữ liệu nhiệt độ) trong Data Lake Storage. Bạn có thể để dữ liệu trong kho lưu trữ và sau đó lọc qua dữ liệu đó để tạo chế độ xem dữ liệu mỗi giờ hoặc mỗi tuần. Lưu trữ dữ liệu trong Data Lake Storage không tốn kém, vì vậy bạn có thể lưu giữ dữ liệu nhiều năm ở đó với chi phí rất thấp.

Bắt đầu với Azure Data Lake Storage bằng Azure Portal

Azure Synapse Analytics

Azure Synapse Analytics (trước đây là Azure SQL Data Warehouse) tập hợp kho dữ liệu doanh nghiệp và phân tích dữ liệu lớn. Nó cho phép bạn tự do truy vấn dữ liệu theo các điều khoản của mình, sử dụng tài nguyên theo yêu cầu không máy chủ hoặc tài nguyên được cung cấp trên quy mô lớn.

Khi bạn cần một giải pháp lưu trữ dữ liệu truyền thống được quản lý hoàn toàn, có thể mở rộng quy mô, hoạt động hiệu quả và an toàn, Azure Synapse Analytics có thể cung cấp giải pháp. Lưu trữ dữ liệu trong các lược đồ được xác định trước và truy vấn nó bằng cách sử dụng phương ngữ SQL Server quen thuộc.

Với Azure Synapse, việc kích hoạt BI và máy học thật dễ dàng. Nó được tích hợp sâu với Power BI và Azure Machine Learning để mở rộng đáng kể việc khám phá thông tin chi tiết từ tất cả dữ liệu của bạn và áp dụng các mô hình học máy cho tất cả các ứng dụng thông minh của bạn.

Xây dựng các giải pháp phân tích đầu cuối với trải nghiệm thống nhất. Azure Synapse studio cung cấp một không gian làm việc thống nhất cho các nhiệm vụ chuẩn bị dữ liệu, quản lý dữ liệu, lưu trữ dữ liệu, dữ liệu lớn và AI. Các kỹ sư dữ liệu có thể sử dụng môi trường trực quan không có mã để quản lý đường ống dữ liệu và các nhà phân tích kinh doanh có thể truy cập an toàn vào bộ dữ liệu và sử dụng Power BI để tạo bảng điều khiển trong vài phút, tất cả trong khi sử dụng cùng một dịch vụ phân tích.

Tạo nhóm SQL Azure Synapse Analytics

Leave a Reply

Your email address will not be published. Required fields are marked *