1. Biến độc lập:
Biến độc lập (independent variable) là những biến số mà sự hiện diện của nó sẽ tác động đến các biến số khác.
2. Biến phụ thuộc:
Biến phụ thuộc (dependent variable): là những biến số mà sự hiện diện, tồn tại hoặc thay đổi của nó là kết quả tác động đến từ biến độc lập.
Bản chất của mối quan hệ Độc lập - phụ thuộc chính là mối quan hệ nhân quả, tuy nhiên, ta cần hết sức cẩn trọng khi đưa ra kết luận nhân quả giữa hai biến số này vì rất có thể còn tồn tại các biến số khác thực sự tác động lên kết quả hiện tại mà ta chưa phát hiện ra.
3. Trung bình (mean)
Trung bình là một chỉ số thống kê đại diện cho giá trị trung tâm của một tập hợp dữ liệu. Để tính trung bình, ta cộng tất cả các giá trị trong tập hợp lại và chia cho số lượng các giá trị đó. Công thức tính trung bình của một dãy số là:
Trung bình = Tổng các giá trị / Số lượng giá trị
Cách biểu diễn khác:
Mean = (x1 + x2 + … + xn) / n
Trong đó:
x1, x2, …, xn là các giá trị trong tập dữ liệu.
n là số lượng các giá trị trong tập dữ liệu.
Trung bình có thể là trung bình cộng (mean) hoặc trung bình có trọng số (weighted mean), tùy thuộc vào trường hợp cụ thể của dữ liệu. Trường hợp công thức ở trên là trung bình không có trọng số
4. Trung vị (median)
Trung vị là giá trị ở giữa của một tập hợp dữ liệu đã được sắp xếp theo thứ tự tăng dần hoặc giảm dần. Để tính trung vị, ta đơn giản là chọn giá trị ở vị trí giữa của dãy số. Nếu số lượng giá trị trong tập hợp là lẻ, thì trung vị sẽ là giá trị ở vị trí (n + 1) / 2, trong đó n là số lượng giá trị. Nếu số lượng giá trị là chẵn, thì trung vị sẽ là trung bình cộng của hai giá trị ở vị trí n/2 và (n/2 + 1).
Như vậy, trung vị nó có thể là số không xuất hiện trong chuỗi số liệu cho trước, các bạn lưu ý để không bị nhầm lẫn nhé.
5. Sự khác nhau giữa trung bình và trung vị
Trung bình được tính toán bằng cách cộng tất cả các giá trị lại và chia cho số lượng giá trị, trong khi trung vị là giá trị ở giữa của dãy số đã được sắp xếp.
Trung bình dễ bị ảnh hưởng bởi các giá trị ngoại lệ (outliers) trong dữ liệu vì nó tính toán dựa trên tổng của các giá trị, trong khi trung vị ít bị ảnh hưởng bởi các giá trị ngoại lệ. Giá trị ngoại lệ là giá trị rất nhỏ hoặc rất lớn so với đa số các biến khác. Ví dụ bạn có các số sau: 1, 2, 3, 5, 100 thì số 100 chính là ngoại lệ và nó khác rất xa các số còn lại
Độ nhạy với giá trị ngoại lệ: Trung bình có thể bị ảnh hưởng bởi các giá trị ngoại lệ trong dữ liệu, trong khi trung vị không bị ảnh hưởng nhiều bởi các giá trị ngoại lệ. Trung vị được sử dụng để đo lường giá trị trung tâm của dữ liệu mà không bị ảnh hưởng nhiều bởi các giá trị ngoại lệ. Nó là một phép đo đơn giản và ổn định trong trường hợp dữ liệu có các giá trị ngoại lệ.
Đối xứng và phân bố của dữ liệu: Trung vị được sử dụng