# Data warehouse

By [Jim](https://paragraph.com/@jim-12) · 2023-10-05

---

Data warehouse là hệ thống tổng hợp dữ liệu từ nhiều nguồn khác nhau vào một kho dữ liệu thống nhất , trung tâm , duy nhất để giúp phân tích dữ liệu , khai thác dữ liệu , trí tuệ nhân tạo và máy học

Kiến trúc data warehouse gồm 3 lớp

1.  Lớp dưới cùng : gồm máy chủ data warehouse , thường là hệ thống cơ sở dữ liệu quan hệ , thu thập , làm sạch chuyển đổi dữ liệu từ nhiều nguồn thông qua quy trình ETL và ELT
    
2.  Lớp giữa : bao gồm máy chủ OLAP ( xử lý phân tích trực tuyến ) cho phép tốc độ truy vấn nhanh
    
3.  Lớp trên cùng : bao gồm giao diện người dùng hoặc công cụ báo cáo , cho phép người dùng cuối phân tích dựa trên dữ liệu của họ
    

![](https://storage.googleapis.com/papyrus_images/13d01d39f7710634f2699cde4f3c0c2bb1bdcf79037649ddc1b7b515642b2061.png)

Điểm khác biệt giữa cơ sở dữ liệu và kho dữ liệu

Cơ sở dữ liệu tập trung vào cập nhập dữ liệu thay đổi theo thời gian thực , còn kho dữ liệu dùng để phân tích , ra quyết định

Lợi ích của kho dữ liệu

1.  Ra quyết định kinh doanh tốt hơn : vì kho dữ liệu tập trung dữ liệu từ nhiều nguồn khác nhau và được làm sạch , cấu trúc thành một nguồn sự thật
    
2.  Chất lượng dữ liệu tốt hơn : vì dữ liệu được phân tích , và kết hợp với ML để có thể đưa ra dự báo và phân tích
    
3.  Thông tin chi tiết về doanh nghiệp nhanh hơn
    

Space and Time ánh xạ kho dữ liệu phi tập trung giống Snowflake

![](https://storage.googleapis.com/papyrus_images/75bcb41ef1a79b8071939cbf83c64ea30e58f0d05b5dd76e31bd984f04588b15.png)

Gồm dữ liệu onchain + offchain , truy vấn dữ liệu onchain giống với The Graph , dữ liệu offchain thì giống Snowflake

Kho dữ liệu rất phù hợp trong ML , AI vì dữ liệu đã được cấu trúc

SxT trong sản phẩm về truy vấn onchain sẽ không cạnh tranh được với The Graph , còn về các phân tích và bảng dữ liệu từ onchain sẽ không cạnh tranh được với Dune , vậy còn sản phẩm là về dữ liệu offchain sẽ phải cạnh tranh với Snowflake và Databricks

---

*Originally published on [Jim](https://paragraph.com/@jim-12/data-warehouse)*
