Đang Tải...

Trang chủ
Tot Blog

Kiến thức & Tin công nghệ

Prometheus: Bước tiến vượt trội trong giám sát hệ thống

22/05/2023

icon

Một trong những yếu tố giúp tổ chức phát triển hiệu quả nhất là phân tích các số liệu đo lường để theo dõi và hiểu về hiệu suất hệ thống cơ sở hạ tầng và ứng dụng của họ. Các tổ chức sẽ sử dụng cơ sở dữ liệu chuỗi thời gian (TSDB) để quản lý, cái tên nổi tiếng nhất hiện nay là nền tảng giám sát Prometheus. Hãy cùng bắt đầu với bài viết “Prometheus: Bước tiến vượt trội trong giám sát hệ thống”.

Mục lục

Mục lục

1. Giới thiệu Prometheus 

1.1. Ý nghĩa của cái tên Prometheus

Trong thần thoại Hy Lạp, Prometheus, có thể có nghĩa là “người biết trước tương lai”, là một vị thần Titan của lửa. Prometheus nổi tiếng với sự thông minh và việc làm người hùng cho loài người, và cũng được coi là tác giả của các nghệ thuật và khoa học của con người nói chung.

Prometheus

1.2. Phần mềm giám sát Prometheus là gì?

Đây là một công cụ giám sát để thu thập và xử lý bất kỳ chuỗi thời gian nào chỉ chứa các con số. Bên cạnh các số liệu, các định danh cá nhân và dấu thời gian, nó thu thập, sắp xếp và lưu trữ chúng.

Prometheus là một phần mềm mã nguồn mở “scrapes” (khai thác) các điểm cuối HTTP của số liệu để thu thập số liệu từ các mục tiêu. Các nền tảng cho cơ sở hạ tầng (như Kubernetes), ứng dụng và dịch vụ đều được hỗ trợ là “mục tiêu” (ví dụ: hệ thống quản lý cơ sở dữ liệu). Prometheus là một công cụ thu thập số liệu linh hoạt và cảnh báo hoạt động cùng với dịch vụ Alertmanager tương ứng.

SoundCloud đã khởi đầu xây dựng Prometheus từ năm 2012. Prometheus đã được rất nhiều hệ thống tin tưởng áp dụng. Dự án có một cộng đồng người đóng góp, phát triển rất tích cực.

Giờ đây Prometheus đã được tách khỏi SoundCloud và là một dự án mã nguồn mở độc lập. Năm 2016, Prometheus tham gia vào tổ chức CNCF (Cloud Native Computing Foundation) với vị trí được ưu tiên phát triển thứ hai sau K8s (Kubernetes).

2. Một số tính năng nổi bật của Prometheus

Phần mềm Prometheus là gì?
  • Mô hình dữ liệu đa chiều sử dụng số liệu để xác định dữ liệu chuỗi thời gian.
  • Các cặp khóa/giá trị và tên để định danh dữ liệu.
  • Ngôn ngữ truy vấn linh hoạt PromQL để tận dụng tính chiều của dữ liệu này.
  • Không phụ thuộc vào lưu trữ phân tán; các nút máy chủ độc lập với nhau.
  • Sử dụng mô hình pull thông qua giao thức HTTP để thu thập dữ liệu chuỗi thời gian.
  • Hỗ trợ cổng trung gian để đẩy dữ liệu chuỗi thời gian.
  • Tìm kiếm mục tiêu thông qua cấu hình tĩnh hoặc khám phá dịch vụ.
  • Hỗ trợ nhiều phương pháp đồ thị và bảng điều khiển khác nhau.

3. Kiến trúc của Prometheus

Kiến trúc của Prometheus giúp dễ dàng tìm và thu thập dữ liệu từ các mục tiêu cung cấp dữ liệu cần thiết. Các ứng dụng được thiết kế của công ty hoặc một ứng dụng bên thứ ba có thể là mục tiêu. Dữ liệu được thu thập được lưu trữ trong Prometheus, nơi bạn có thể sử dụng PromQL (Prometheus Query Language) để xem xét nó.

Kiến trúc của Prometheus

Prometheus thu thập số liệu từ các công việc đã được thiết kế, trực tiếp hoặc thông qua một cổng trung gian đẩy dữ liệu cho các công việc ngắn hạn. Nó theo dõi tất cả các mẫu được thu thập cục bộ và áp dụng các quy tắc cho chúng để tạo ra các chuỗi thời gian mới từ dữ liệu hiện có hoặc cảnh báo người dùng. Dữ liệu thu thập được có thể được hiển thị bằng cách sử dụng Grafana hoặc các API tiêu dùng khác.

4. Metric là gì?

Metric là các đo lường số, để sử dụng thuật ngữ phổ biến. Sự thay đổi được theo dõi theo thời gian trong một chuỗi thời gian. Các metric mà người dùng cố gắng đo lường có thể thay đổi tùy thuộc vào ứng dụng. Đó có thể là thời gian yêu cầu cho một máy chủ web, số lượng kết nối hoặc truy vấn hoạt động trong cơ sở dữ liệu, v.v.

Nó rất quan trọng để giúp bạn hiểu tại sao ứng dụng của bạn hoạt động theo cách nhất định. Giả sử bạn đang sử dụng một ứng dụng web và nó chạy chậm. Để biết điều gì đang xảy ra với ứng dụng của bạn, bạn sẽ cần một số thông tin. Ví dụ, nếu có nhiều yêu cầu, ứng dụng có thể trở nên chậm chạp. Bằng cách sử dụng metric đếm yêu cầu, bạn có thể xác định nguyên nhân và thêm các máy chủ để xử lý tải nếu cần.

5. Loại Metric của Prometheus

Prometheus giám sát bốn loại metric chính:

5.1. Counter (Đếm)

Counter là một trong những loại metric cơ bản nhất. Nó hữu ích để theo dõi và đánh giá các giá trị chỉ tăng lên. Bạn có thể đặt lại giá trị về 0 và tiến hành đo lường mới khi nó đạt đến một giá trị cụ thể.

5.2. Gauge (Đo lường)

Gauge được sử dụng để đo lường các giá trị tăng và giảm. Điều này bao gồm số lượng yêu cầu đồng thời hoặc việc sử dụng bộ nhớ trong thời điểm hiện tại. Thông thường, metric này được biểu diễn bằng một giá trị số duy nhất.

5.3. Summary (Tổng quan)

Summary hiển thị số lượng quan sát và tổng giá trị quan sát sau khi thực hiện mẫu. Ngoài ra, nó xác định các quantiles biến đổi trên một cửa sổ thời gian trượt.

5.4. Histogram (Biểu đồ tần số)

Histogram được sử dụng để đại diện cho dữ liệu như thời gian phản hồi, kích thước mẫu và các quan sát liên quan khác. Thông thường, nó cung cấp tổng số tất cả các giá trị và số lần đếm trong các bucket. Cách tính toán metric có thể được tùy chỉnh để đáp ứng yêu cầu của bạn.

Lưu ý rằng vị trí và phương pháp sử dụng để tính các quantiles thống kê tạo ra sự khác biệt đáng kể giữa summaries và histograms. Trong khi quantiles của histogram có thể được tính toán phía máy chủ bằng cách sử dụng biểu thức PromQL, quantiles cho summaries được tính toán phía máy khách. Hãy chọn loại metric thống kê phù hợp với ứng dụng của bạn vì cả hai chiến lược đều có sự đánh đổi.

Loại metric của Prometheus

6. Prometheus hoạt động như thế nào với môi trường phát triển?

Prometheus thu thập thông tin dựa trên một số metric. Để hoạt động hiệu quả, nó phải hỗ trợ đa số các ngôn ngữ lập trình và phát triển phổ biến.

Với điều này, Prometheus cung cấp các thư viện cho nhiều ngôn ngữ lập trình khác nhau, bao gồm: Go, Ruby, Python, Java.

Đối với các ngôn ngữ khác phổ biến, các thư viện đang được phát triển, nhưng chưa được chính thức. Điều này bao gồm Node.js, C# và Rust. Ngay cả các tác vụ lập trình ngắn hạn như xử lý theo lô cũng có thể được cấu hình để được giám sát bởi Prometheus bằng cách sử dụng PushJobs.

Phương pháp tốt nhất để giám sát ứng dụng là thu thập thông tin từ các điểm cuối (endpoints). Các thư viện cung cấp các endpoint cho nhiều loại metric khác nhau. Tuy nhiên, Prometheus cần được thiết lập theo cách đó. Nếu không, nếu chương trình của bạn gặp sự cố, bạn có nguy cơ mất dữ liệu.

7. Một số thuật ngữ quan trọng với Prometheus

Sau đây là một số thuật ngữ thường được sử dụng trong Prometheus mà bạn nên nắm bắt ý nghĩa của nó.

  • Time-series Data: là một chuỗi các điểm dữ liệu, thường bao gồm các phép đo liên tiếp được thực hiện từ cùng một nguồn trong một khoảng thời gian.
  • Alert : một cảnh báo (alert) là kết quả của việc đạt điều kiện thoả mãn một rule cảnh báo được cấu hình trong Prometheus. Các cảnh báo sẽ được gửi đến dịch vụ Alertmanager.
  • Alertmanager: chương trình đảm nhận nhiệm vụ tiếp nhận, xử lý các hoạt động cảnh báo.
  • Client Library: một số thư viện hỗ trợ người dùng có thể tự tuỳ chỉnh lập trình phương thức riêng để lấy dữ liệu từ hệ thống và đẩy dữ liệu metric về Prometheus.
  • Endpoint: nguồn dữ liệu của các chỉ số (metric) mà Prometheus sẽ đi lấy thông tin.
  • Exporter: là một chương trình được sử dụng với mục đích thu thập, chuyển đổi các metric không ở dạng kiểu dữ liệu chuẩn Prometheus sang chuẩn dữ liệu Prometheus. Sau đấy exporter sẽ expose web service api chứa thông tin các metrics hoặc đẩy về Prometheus.
  • Instance: một instance là một nhãn (label) dùng để định danh duy nhất cho một target trong một job .
  • Job: là một tập hợp các target chung một nhóm mục đích. Ví dụ: giám sát một nhóm các dịch vụ database,… thì ta gọi đó là một job .
  • PromQL: là viết tắt của Prometheus Query Language, ngôn ngữ này cho phép bạn thực hiện các hoạt động liên quan đến dữ liệu metric.
  • Sample: là một giá trị đơn lẻ tại một thời điểm thời gian trong khoảng thời gian time series.
  • Target: một target là định nghĩa một đối tượng sẽ được Prometheus đi lấy dữ liệu (scrape). Ví dụ như: nhãn nào sẽ được sử dụng cho đối tượng, hình thức chứng thực nào sử dụng hoặc các thông tin cần thiết để quá trình đi lấy dữ liệu ở đối tượng được diễn ra.

8. Cài đặt và thử nghiệm Prometheus

Để thử nghiệm Prometheus, các bạn hãy làm theo hướng dẫn trong link sau:

Cài đặt và thử nghiệm Prometheus

Lời kết

Trên đây là nội dung cơ bản về Prometheus. Hãy xem xét tính năng và mô hình để áp dụng vào hệ thống của bạn nhé. Ở bài sau chúng ta sẽ cài đặt một hệ thống theo dõi và cảnh báo đơn giản với Prometheus và Grafana. 

TelegramCommunity
scroll top
Thông báo
Đóng