×

Sử dụng STD() để tính độ lệch chuẩn trong MySQL

Trong quá trình làm việc với cơ sở dữ liệu, đôi khi bạn cần tính toán thống kê để phân tích dữ liệu một cách chi tiết hơn. Một trong những công cụ hữu ích giúp bạn thực hiện điều này là hàm tính độ lệch chuẩn. Độ lệch chuẩn là một đại lượng quan trọng trong thống kê giúp bạn hiểu sâu hơn về sự phân bố của dữ liệu. Trong MySQL, bạn có thể sử dụng hàm để tính độ lệch chuẩn một cách dễ dàng và nhanh chóng.

Độ lệch chuẩn là gì?

Độ lệch chuẩn là một thước đo thống kê biểu thị mức độ phân tán của một tập dữ liệu so với giá trị trung bình của nó. Độ lệch chuẩn càng nhỏ, dữ liệu của bạn càng gần với giá trị trung bình. Ngược lại, độ lệch chuẩn càng lớn, dữ liệu càng phân tán.

Hàm tính độ lệch chuẩn trong MySQL

Trong MySQL, bạn có thể sử dụng hàm để tính độ lệch chuẩn theo hai biến thể là STDDEV_POP()STDDEV_SAMP().

  1. STDDEV_POP(): Tính độ lệch chuẩn của toàn bộ quần thể (population standard deviation).
  2. STDDEV_SAMP(): Tính độ lệch chuẩn của mẫu (sample standard deviation).

Dưới đây là cú pháp của từng hàm:

  • STDDEV_POP(expression) – Tính toán độ lệch chuẩn của toàn bộ quần thể từ những giá trị cột được chỉ định.
  • STDDEV_SAMP(expression) – Tính toán độ lệch chuẩn của mẫu từ những giá trị cột được chỉ định.

Cách sử dụng hàm tính độ lệch chuẩn

Để minh họa cách sử dụng, hãy tạo một bảng dữ liệu mẫu và sau đó áp dụng các hàm này.

  1. Tạo bảng dữ liệu mẫu:
CREATE TABLE scores (
    student_id INT,
    score INT
);

INSERT INTO scores (student_id, score) VALUES
(1, 90),
(2, 80),
(3, 70),
(4, 60),
(5, 85);
  1. Tính toán độ lệch chuẩn của toàn bộ quần thể:
SELECT STDDEV_POP(score) AS population_stddev FROM scores;
  1. Tính toán độ lệch chuẩn của mẫu:
SELECT STDDEV_SAMP(score) AS sample_stddev FROM scores;

Sự khác biệt giữa STDDEV_POP()STDDEV_SAMP()

  • STDDEV_POP(): Được sử dụng khi bạn cần tính độ lệch chuẩn của toàn bộ tập dữ liệu (quần thể). Khi mẫu dữ liệu bạn có bao gồm toàn bộ dữ liệu cần phân tích, sử dụng hàm này để có kết quả chính xác.

  • STDDEV_SAMP(): Được sử dụng khi bạn chỉ có một mẫu của tập dữ liệu tổng thể. Ví dụ, nếu bạn chỉ có một mẫu nhỏ từ một tổng thể lớn hơn và muốn ước lượng độ lệch chuẩn của tổng thể đó, bạn nên sử dụng hàm này.

Lời kết

Việc tính toán độ lệch chuẩn trong MySQL là một thao tác đơn giản nhưng vô cùng hữu ích. Hàm tính độ lệch chuẩn giúp bạn có cái nhìn chính xác hơn về mức độ phân tán của dữ liệu, từ đó có thể đưa ra những phân tích và quyết định hợp lý hơn trong quản lý và khai thác dữ liệu.

Comments