Chọn mẫu phân tổ (Stratified sampling) là gì? Ưu điểm của mẫu phân tổ?

Mẫu phân tổ (Stratified sampling) là gì ? Ưu điểm của mẫu phân tổ (Stratified sampling) là gì? Lý do phải chọn mẫu và phương pháp chọn mẫu hiện nay như thế nào? Cùng tìm hiểu nhé!

1 340 04/01/2024


Chọn mẫu phân tổ (Stratified sampling) là gì? Ưu điểm của mẫu phân tổ?

1. Mẫu phân tổ (Stratified sampling) được hiểu là như thế nào?

Mẫu phân tổ (Stratified sampling) là một mẫu được lựa chọn bằng cách chia tổng thể điều tra thành nhiều nhóm, loại khác nhau (gọi là tổ), sau đó lựa chọn số đơn vị điều tra theo tỷ trọng của mỗi tổ trong tổng thể điều tra.

Chọn mẫu phân tổ (Stratified sampling) là gì? Ưu điểm của mẫu phân tổ? (ảnh 1)

Muốn chọn mẫu phân tổ, trước tiên phân chia tổng thể thành các tổ theo 1 tiêu thức hay nhiều tiêu thức có liên quan đến mục đích nghiên cứu (như phân tổ các doanh nghiệp theo vùng, theo khu vực, theo loại hình, theo quy mô,…). Sau đó trong từng tổ, dùng cách chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu hệ thống để chọn ra các đơn vị của mẫu. Đối với chọn mẫu phân tầng, số đơn vị chọn ra ở mỗi tổ có thể tuân theo tỷ lệ số đơn vị tổ đó chiếm trong tổng thể, hoặc có thể không tuân theo tỷ lệ.

Ví dụ: Một toà soạn báo muốn tiến hành nghiên cứu trên một mẫu 1000 doanh nghiệp trên cả nước về sự quan tâm của họ đối với tờ báo nhằm tiếp thị việc đưa thông tin quảng cáo trên báo. Toà soạn có thể căn cứ vào các tiêu thức : vùng địa lý (miền Bắc, miền Trung, miền Nam) ; hình thức sở hữu (quốc doanh, ngoài quốc doanh, công ty 100% vốn nước ngoài,…) để quyết định cơ cấu của mẫu nghiên cứu.

2. Ưu điểm của mẫu phân tổ (Stratified sampling) là gì?

Lý do sử dụng lấy mẫu phân tổ thay vì lấy mẫu ngẫu nhiên đơn giản bao gồm:

  • Nếu các phép đo trong phạm vi phân tầng có độ lệch chuẩn thấp hơn, thì sự phân tầng cho sai số nhỏ hơn trong ước lượng.
  • Đối với nhiều ứng dụng, các phép đo trở nên dễ quản lý hơn và / hoặc rẻ hơn khi tổng thể được nhóm thành các tổ.
  • Nếu mật độ tổng thể thay đổi rất nhiều trong một khu vực, việc lấy mẫu phân tầng sẽ đảm bảo rằng các ước lượng có thể được thực hiện với độ chính xác tương đương ở các phần khác nhau của khu vực và việc so sánh các tiểu vùng có thể được thực hiện với sức mạnh thống kê như nhau. Ví dụ, ở Ontario, một cuộc khảo sát trên toàn tỉnh có thể sử dụng một phần lấy mẫu lớn hơn ở miền bắc nơi có ít dân cư hơn, vì sự chênh lệch về dân số giữa bắc và nam là rất lớn dẫn đến khả năng người thống kê chỉ một số ít dữ liệu từ phía bắc.

Phương pháp phân tổ này phần nào cũng dựa vào những kinh nghiệm phán đoán chủ quan nên cần phải tuân theo những nguyên tắc chung khi tiến hành phân tổ như:

- Trong mỗi tổ phải đảm bảo tính đồng chất;

- Số tổ không nên chia quá ít hoặc quá nhiều;

- Số đơn vị mẫu của từng tổ phải đủ lớn để đảm bảo độ tin cậy cho suy rộng, hay ước lượng.

Ví dụ, trong trường hợp chọn mẫu điều tra doanh nghiệp: người ta sẽ tiến hành phân chia các doanh nghiệp theo qui mô (lớn, vừa và nhỏ), sau đó sẽ tiến hành xác định kích thước mẫu của cuộc điều tra và tiến hành phân bổ các đơn vị cho mỗi loại hình qui mô doanh nghiệp.

Chọn mẫu phân tổ (Stratified sampling) là gì? Ưu điểm của mẫu phân tổ? (ảnh 1)

3. Lý do phải chọn mẫu và phương pháp chọn mẫu hiện nay như thế nào?

Việc chọn mẫu sẽ xuất phát từ những lý do sau đây:

  • Tiết kiệm thời gian, chi phí, nhân lực so với việc khảo sát/nghiên cứu trên toàn bộ đối tượng
  • Chọn mẫu đúng cách để đạt được mức chính xác cần có của kết quả
  • Tốc độ thu thập dữ liệu nhanh hơn, đảm bảo tính kịp thời của số liệu thống kê.
  • Tính sẵn có của các đơn vị tổng thể
  • Thu thập được nhiều chỉ tiêu thống kê, đặc biệt các chỉ tiêu có nội dung phức tạp, không có điều kiện điều tra ở diện rộng.
  • Chọn mẫu trong nghiên cứu giúp giảm sai số khi chọn mẫu sai (do sai số cân, đo, đếm, khai báo, ghi chép,..)
  • Khuyết điểm của việc chọn mẫu: tồn tại “sai số”

Hiện nay có 2 phương pháp chọn mẫu, chi tiết như sau:

Chọn mẫu xác suất: biết được xác suất lượng đối tượng tham gia khảo sát, quá trình chọn mẫu sử dụng các phương pháp dựa trên lý thuyết xác suất. Khả năng được chọn thành mẫu của tất cả đơn vị trong tổng thể đều như nhau.

Chọn mẫu phi xác suất: quá trình lựa chọn không cố định hoặc được xác định từ trước mà thường dựa trên khả năng chọn mẫu của nhà nghiên cứu. Khả năng được chọn thành mẫu của tất cả đơn vị trong tổng thể không ngang nhau.

Chọn mẫu xác suất

- Chọn mẫu ngẫu nhiên đơn giản: mọi đơn vị của tổng thể được chọn một cách ngẫu nhiên, tình cờ. Xác suất được chọn đều như nhau giữa các đối tượng nghiên cứu.

- Chọn mẫu theo cụm: chia nhỏ tổng thể thành từng cụm để đại diện cho tổng thể. Các cụm được chia dựa trên thông số nhân khẩu học như tuổi tác, giới tính, địa chỉ hoặc khối, đoàn (VD phường, làng, xã, huyện,…). Nhà nghiên cứu lựa chọn một số cụm đã chia và tiến hành nghiên cứu/khảo sát trên các cụm đã chọn đó. Phương pháp được sử dụng khi không có sẵn danh sách đầy đủ của các đơn vị trong tổng thể.

- Chọn mẫu theo hệ thống: Đánh số/điểm bắt đầu của tổng thể theo thứ tự và chọn các mẫu với kích cỡ như nhau, với khoảng cách giữa các mẫu được chọn trong tổng thể ngang nhau. Phương pháp sử dụng khi đã có phạm vị xác định từ trước, kĩ thuật lấy mẫu tốn ít thời gian nhất.

- Chọn mẫu ngẫu nhiên phân tầng: chia tổng thể thành từng nhóm nhỏ không trùng nhau theo 1 hoặc 1 vài tiêu thức liên quan đến mục đích nghiên cứu (mỗi nhóm đều có đủ tính cách đại diện cho tổng thể). Khi chọn mẫu, các nhóm nhỏ được sắp xếp lại và nhà nghiên cứu sẽ chọn một mẫu từ mỗi nhóm một cách riêng biệt.

Tác dụng của chọn mẫu xác suất

- Giảm độ lệch mẫu: độ lệch mẫu không đáng kể hoặc không tồn tại. Việc lựa chọn chủ yếu dựa trên hiểu biết và suy luận của người nghiên cứu. Dữ liệu thu được chất lượng cao hơn vì mẫu đại diện cho tổng thể thích hợp hơn.

- Tổng thể đa dạng: Khi các đơn vị trong tổng thể quá rộng lớn và đa dạng, điều cần thiết là phải có sự đại diện đầy đủ để dữ liệu không bị lệch về một nhân khẩu học, hoặc một khía cạnh nhất định trong tổng thể.

- Tạo mẫu chính xác: Lấy mẫu theo xác suất giúp các nhà nghiên cứu lập kế hoạch và tạo ra mẫu chính xác. Điều này giúp thu được dữ liệu xác định rõ ràng.

Chọn mẫu phi xác suất

- Chọn mẫu thuận tiện: dựa trên khả năng tiếp cận đối tượng khảo sát: tính dễ dàng, thuận tiện trong quá trình thực hiện, tiếp cận và liên hệ tới các đối tượng của nhà nghiên cứu mà không có bất kì thẩm quyền lựa chọn nào và không có tính đại diện. Phương pháp này thường được thực hiện khi thời gian, chi phí hoặc nhân lực bị giới hạn.

- Chọn mẫu theo phán đoán hoặc có mục đích: dựa trên quyết định của người nghiên cứu. Những người này sẽ xem xét, cân nhắc mục đích của nghiên cứu cùng với sự hiểu biết của chính các đơn vị của tổng thể để thực hiện chọn mẫu. Do tính chất có phần phụ thuộc vào sự hiểu biết của mẫu, phương pháp chỉ áp dụng khi các đặc tính của đơn vị trong tổng thể được chọn đã khá rõ rang.

- Chọn mẫu theo lí thuyết quả cầu tuyết: phương pháp cần các nhà nghiên cứu tham gia thực hiện cộng tác khi chủ đề hoặc đối tượng cần nghiên cứu quá khó, quá nhạy cảm để tiến hành theo cách thông thường. Chẳng hạn như đối tượng là những người nhập cư, di dân hoặc những người bị nhiễm HIV Aids. Khi đó, các nhà nghiên cứu sẽ liên hê với những người thuộc đối tượng khảo sát mà họ quen biết, hoặc liên hệ với các tình nguyện viên, những người quen biết, có liên hệ tới đối tượng khảo sát đê thu thập thông tin.

- Chọn mẫu theo hạn ngạch: các đối tượng được chọn dựa trên một số tiêu chuẩn cố định. Các đơn vị được lựa chọn trên tiểu chuẩn đã xác định trước đó sao cho tổng mẫu có cùng phân phối, tỉ lệ và các đặc điểm giả định tồn tại trong chính tổng thể.

Tác dụng của chọn mẫu phi xác suất

- Tạo giả thuyết: Các nhà nghiên cứu sử dụng phương pháp chọn mẫu phi xác suất để tạo ra một giả định khi bị giới hạn thông tin, thông tin không sẵn có. Phương pháp này giúp trả về dữ liệu ngay lập tức và xây dựng cơ sở để nghiên cứu thêm.

- Nghiên cứu thăm dò: Các nhà nghiên cứu sử dụng rộng rãi kỹ thuật lấy mẫu này khi thực hiện nghiên cứu định tính, nghiên cứu thử nghiệm hoặc nghiên cứu thăm dò.

- Ràng buộc về ngân sách và thời gian: khi có những ràng buộc về ngân sách và thời gian, đồng thời phải thu thập một số dữ liệu sơ bộ. Vì thiết kế khảo sát không cứng nhắc, nên việc chọn ngẫu nhiên người trả lời và yêu cầu họ thực hiện khảo sát hoặc bảng câu hỏi sẽ dễ dàng hơn.

1 340 04/01/2024