Một số phương pháp chọn mẫu và tính quy mô mẫu trong nghiên cứu khoa học

ThS.NCS. Hoàng Thị Huyền

Tóm tắt: Phương pháp chọn mẫu và tính quy mô mẫu rất cần thiết trong nghiên cứu khoa học. Có nhiều phương pháp chọn mẫu và cách tính quy mô mẫu. Bài viết trình bày khái quát về mẫu; yêu cầu, quy trình chọn mẫu; các phương pháp chọn mẫu bao gồm chọn mẫu xác suất và chọn mẫu phi xác suất, một số cách tính quy mô mẫu trong nghiên cứu khoa học. Từ đó, độc giả quan tâm có thể tham khảo và lựa chọn phương pháp chọn mẫu, cách tính cỡ mẫu phù hợp với nghiên cứu của mình nhằm tiết kiệm được chi phí, thời gian trong quá trình nghiên cứu đồng thời đảm bảo được giá trị và tính khái quát cho tổng thể nghiên cứu.

Từ khóa:  mẫu, tổng thể, chọn mẫu, cỡ mẫu, quy mô mẫu

 

I. ĐẶT VẤN ĐỀ

Trong nghiên cứu khoa học, thường rất khó thực hiện nghiên cứu tất cả tổng thể bởi đa số tổng thể nghiên cứu thường quá lớn, khó thực hiện và tốn kém nhiều chi phí, thời gian. Việc lựa chọn mẫu của tổng thể để nghiên cứu là rất cần thiết và phổ biến. Do đó, cần có phương pháp khoa học để người nghiên cứu có thể tiến hành thực hiện trên một mẫu nhỏ hơn nhiều so với quy mô tổng thể nhưng vẫn đưa ra được kết luận có giá trị và tính khái quát cao cho tổng thể nghiên cứu.

II. NỘI DUNG

1. Khái niệm tổng thể và mẫu nghiên cứu (population & sample)

Trong mỗi nghiên cứu, tổng thể nghiên cứu bao gồm toàn bộ đối tượng nghiên cứu mà đề tài nghiên cứu hướng tới.

 Lý tưởng nhất là nghiên cứu toàn bộ tổng thể, tuy nhiên do điều kiện nguồn lực có hạn nên với mỗi nghiên cứu, các nhà nghiên cứu thường không thể tiến hành nghiên cứu trên toàn bộ tổng thể mà chỉ tiến hành nghiên cứu trên một mẫu.

Mẫu là một phần của tổng thể được lựa chọn để nghiên cứu, mẫu đại diện của một tổng thể và mức độ đại diện phải được xác định hay đo lường được.

2. Chọn mẫu (Sampling)

Chọn mẫu là quá trình lựa chọn một bộ phận từ tổng thể với tính chất là đại diện cho tổng thể cần nghiên cứu. Dựa trên kết quả thu được từ mẫu, nhà nghiên cứu sẽ suy diễn kết quả nghiên cứu tổng thể.

 2.1. Yêu cầu chọn mẫu

Khi chọn mẫu, thường đặt ra ba câu hỏi:

- Tổng thể nào mà mẫu được lấy ra cho nghiên cứu?

- Làm thế nào mẫu có thể đại diện cho tổng thể nghiên cứu?

- Mẫu bao nhiêu là đủ cho một nghiên cứu?

Việc xác định tổng thể nghiên cứu tùy thuộc vào nhiều vấn đề như ý tưởng nghiên cứu, vấn đề cần được nghiên cứu, các thông tin sẵn có cho việc chọn mẫu, phương pháp chọn mẫu, nguồn lực phục vụ cho quá trình nghiên cứu,…

Mẫu nghiên cứu được đánh giá là tốt nếu đáp ứng được các tiêu chuẩn:

- Tính đại diện: mẫu được chọn có các tính chất cơ bản của tổng thể.

- Kích thước mẫu đủ lớn: nhằm có thể cho phép khái quát hóa một cách tin cậy cho tổng thể nghiên cứu.

- Tính thực tế và tiện lợi: để việc thu thập dữ liệu thuận tiện và dễ dàng.

- Tính kinh tế và hiệu quả: mẫu được chọn sao cho thông tin thu được là nhiều nhất và chi phí là thấp nhất.

2.2. Quy trình chọn mẫu

Quy trình chọn mẫu là quá trình lựa chọn một bộ phận tương đối nhỏ từ một tổng thể mang tính đại diện cho tổng thể nghiên cứu bao gồm 5 bước theo sơ đồ sau:

 

Lựa chọn phương pháp lấy mẫu: xác suất hoặc phi xác suất

Quyết định quy mô của mẫu

Viết hướng dẫn cho việc xác định và lựa chọn các phần tử trong thực tế của mẫu

Xác định tổng thể nghiên cứu

Xác định khung chọn mẫu

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.3. Phương pháp chọn mẫu

Trên thực tế có rất nhiều phương pháp chọn mẫu, các phương pháp đó thường được xếp vào một trong hai nhóm là chọn mẫu xác suất (probability sampling) và không xác suất (non- probability sampling). Mẫu được chọn theo phương pháp xác suất có tính đại diện cho tổng thể hơn, nhưng thường tốn kém chi phí hơn khi thu thập do mẫu thường phân tán và cỡ mẫu lớn hơn.

·  Chọn mẫu xác suất:

Trong chọn mẫu xác suất, khả năng được chọn của tất cả các đơn vị trong tổng thể vào mẫu là như nhau, có thể áp dụng được các phương pháp ước lượng thống kê, kiểm định giả thuyết thống kê trong xử lý dữ liệu để suy rộng kết quả trên mẫu cho tổng thể chung.

Chọn mẫu xác suất thường bao gồm: ngẫu nhiên đơn giản, ngẫu nhiên có hệ thống, ngẫu nhiên phân tầng, chọn mẫu chùm, chọn mẫu nhiều giai đoạn.

- Chọn mẫu ngẫu nhiên đơn (simple random sampling)

Là phương pháp chọn mẫu trong đó tất cả các cá thể trong tổng thể có cùng cơ hội (cùng xác suất) để được chọn vào mẫu. Mỗi đối tượng trong tổng thể được gán một con số, sau đó các con số được lựa chọn một cách ngẫu nhiên.

+ Ưu điểm: là phương pháp chọn mẫu xác suất cơ bản và có thể lồng vào tất cả các phương pháp chọn mẫu xác suất phức tạp khác, cách làm đơn giản, tính ngẫu nhiên và tính đại diện cao.

+ Nhược điểm:

Cẩn có một danh sách đơn vị mẫu để phục vụ chọn mẫu. Điều này thường không thể thực hiện đối với mẫu lớn hoặc mẫu dao động.

Các cá thể được chọn vào mẫu có thể phân bố tản mạn trong tổng thể, do vậy, việc thu thập dữ liệu rất tốn kém và mất thời gian.

Cách chọn này không quan tâm đến các tầng, các nhóm đối tượng nghiên cứu trong tổng thể nên xác suất chọn vào mẫu có thể không đồng đều giữa các tầng dẫn đến kết quả chung có thể bị ảnh hưởng.

- Chọn mẫu hệ thống (systematic sampling)

Toàn bộ đối tượng trong tổng thể được liệt kê theo thứ tự định trước, sau đó quyết định khoảng cách các đối tượng được lựa chọn.

+ Ưu điểm

Nhanh và dễ áp dụng, có tính đại diện cao hơn chọn ngẫu nhiên. Nếu danh sách cá thể của tổng thể được xếp ngẫu nhiên, chọn mẫu hệ thống tương tự như chọn ngẫu nhiên đơn.

+ Nhược điểm:

Khung mẫu được thiết lập có tính chu kỳ nên mẫu có thể bị sai lệch

- Chọn mẫu ngẫu nhiên phân tầng (stratified random sampling)

Là phương pháp chọn mẫu được thực hiện bởi việc phân chia các cá thể của tổng thể nghiên cứu thành các nhóm riêng rẽ được gọi là tầng. Đặc điểm của chọn mẫu kiểu này là tiêu chí nghiên cứu trong từng tầng tương đối đồng nhất, còn giữa các tầng có sự khác biệt. Sau khi phân tầng xong, có thể áp dụng cách chọn mẫu ngẫu nhiên đơn hoặc ngẫu nhiên hệ thống để chọn đối tượng của từng tầng vào nghiên cứu.

+ Ưu điểm:

Tạo ra trong mỗi tầng có một sự đồng nhất về yếu tố được chọn để nghiên cứu, do đó giảm sự chênh lệch giữa các cá thể.

Mẫu chọn từ mỗi tầng có tính đại diện và khái quát hóa cao cho tầng đó.

Nếu yếu tố được chọn phân tầng có tính đồng nhất cao trong mỗi tầng nhưng lại thấp giữa các tầng thì kết quả nghiên cứu có độ chính xác cao hơn mẫu chọn theo cách ngẫu nhiên đơn (2 cách có cùng cỡ mẫu).

Ngoài việc tính được tham số mẫu cho toàn bộ nghiên cứu, có thể tính được tham số mẫu cho từng tầng.

+ Nhược điểm:

Danh sách tất cả các cá thể trong mỗi tầng phải được liệt kê và được gắn số ngẫu nhiên. Điều này thường khó thực hiện trong thực tế.

- Chọn mẫu chùm (cluster sampling)

Là phương pháp chọn mẫu trong đó việc lựa chọn ngẫu nhiên các nhóm cá thể (được gọi là chùm) từ nhiều chùm trong một tổng thể nghiên cứu. Trong trường hợp này đơn vị mẫu là các chùm chứ không phải là các cá thể.

+ Ưu điểm:

Thường được áp dụng trong các nghiên cứu điều tra có một phạm vi rộng lớn, độ phân tán cao, danh sách của tất cả các cá thể trong tổng thể không thể có được trong khi chỉ có danh sách các chùm.

Sự lựa chọn thường dễ hơn, chi phí cho nghiên cứu với mẫu chùm thường rẻ hơn nhiều do các cá thể trong một chùm thường gần nhau.

+ Nhược điểm:

Tính đại diện cho quần thể hoặc tính chính xác của mẫu được chọn theo phương pháp mẫu chùm thường thấp hơn so với mẫu được chọn bằng phương pháp ngẫu nhiên đơn (nếu có cùng cỡ mẫu)

Có sự tương quan nghịch giữa cỡ của chùm và tính đại diện của mẫu, do vậy, cỡ chùm càng nhỏ càng tốt, tuy nhiên chi phí điều tra sẽ cao hơn. Số chùm được chọn vào nghiên cứu tốt nhất là > 30.

Phân tích số liệu từ mẫu chùm thường phức tạp hơn các mẫu khác.

- Chọn mẫu nhiều giai đoạn (multistage sampling)

Tổng thể nghiên cứu lớn và phức tạp cần áp dụng nhiều phương pháp chọn mẫu trong các giai đoạn khác nhau. Có thể kết hợp mẫu xác suất và không xác suất.

+ Ưu điểm:

Nghiên cứu được mẫu lớn và phức tạp

+ Nhược điểm:

Khi nghiên cứu phải áp dụng nhiều lần chọn mẫu chùm, cỡ mẫu lại phải điều chỉnh với hệ số thiết kế để đảm bảo tính đại diện của mẫu nghiên cứu so với tổng thể.

·  Chọn mẫu phi xác suất

- Chọn mẫu thuận tiện (convenience or accidental sampling)

Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận, dễ lấy thông tin.

+ Ưu điểm:

Sử dụng phổ biến khi bị giới hạn về thời gian, chi phí.

+ Nhược điểm:

Không xác định được sai số lấy mẫu và không thể kết luận cho tổng thể từ kết quả mẫu.

- Chọn mẫu định mức (quota sampling)

Là phương pháp đảm bảo rằng một số nhất định các đơn vị mẫu từ các loại khác nhau của tổng thể nghiên cứu với các tính đặc trưng sẽ có mặt trong mẫu.

- Chọn mẫu phán đoán hay có chủ đích (purposive sampling)

Lấy mẫu theo chủ quan phán đoán của nhà nghiên cứu

+ Ưu điểm:

Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận, dễ lấy thông tin (giống chọn mẫu thuận tiện), nếu có khả năng hoặc kinh nghiệm phán đoán tốt sẽ cho mẫu tốt hơn chọn mẫu thuận tiện.

+  Nhược điểm:

Chỉ áp dụng khi các đặc tính của phần tử được chọn đã khá rõ ràng.

3. Tính toán quy mô mẫu nghiên cứu

Nghiên cứu với một kích thước mẫu càng lớn càng thể hiện được tính chất của tổng thể nhưng lại tốn nhiều thời gian và chi phí. Do đó, việc chọn một kích thước mẫu phù hợp là rất quan trọng. Các yếu tố ảnh hưởng đến cỡ mẫu như: loại thiết kế nghiên cứu, phương pháp chọn mẫu, độ lớn của tham số được nghiên cứu, mức độ sai lệch của tham số mẫu và tham số tổng thể,…

Hiện nay, các nhà nghiên cứu đưa ra các công thức chọn mẫu ngẫu nhiên trong nghiên cứu như của từng phương pháp như: kích thước mẫu cho phân tích nhân tố khám phá EFA, kích thước mẫu cho hồi quy,…Trong phạm vi bài viết, tác giả trình bày một số công thức tính toán cỡ mẫu như sau:

- Công thức tính mẫu tối thiểu:

n =z2(pq) e2

 

Trong đó: n: cỡ mẫu

               z: giá trị phân phối tương ứng với độ tin cậy lựa chọn

                  (nếu độ tin cậy 95% thì giá trị z là 1,96…)

               p: ước tính tỷ lệ % của tổng thể

                q = 1 – p (thường tỷ lệ p và q được ước tính 50%/50% đó là khả năng lớn nhất có thể xảy ra của tổng thể)

                 e: sai số cho phép (+-3%, +-4%,+-5%...).

- Trong trường hợp tổng thể nghiên cứu < 10.000, mẫu tối thiểu có thể điều chỉnh theo công thức sau:

                                                         n’  = n1+(nN)                                                                       n’: cỡ mẫu điều chỉnh

            n: cỡ mẫu

            N: tổng thể

- Để áp dụng công cụ thống kê:

 n ≥ 30 quan sát

- Để phân tích hồi quy tương quan hay kiểm định nhóm:

 n ≥ 8m + 50 (m là biến số độc lập trong mô hình)

- Để phục vụ kiểm định thang đo (phân tích nhân tố), mẫu phải gấp 5 lần số lượng chỉ báo

N = 5* item

III. KẾT LUẬN

Có nhiều phương pháp chọn mẫu, cách tính quy mô mẫu trong nghiên cứu khoa học. Tùy từng nghiên cứu cụ thể mà nhà nghiên cứu lựa chọn, sử dụng phương pháp thích hợp để mẫu đại diện được cho tổng thể đồng thời tiết kiệm chi phí tài chính, nhân lực, thời gian.

           TÀI LIỆU THAM KHẢO

1. Heckathorn, D.D. (2007) Extentsion of Respondent-Driven Sampling: Analyzing Continuous Variables.

2. Nguyễn Minh Hà (2011), ”Phương pháp chọn mẫu”, Nhà xuất bản Đại học Mở TPHCM.

3.  Hoàng Văn Minh (2015), “Phương pháp chọn mẫu và tính toán cỡ mẫu”, Nhà xuất bản Đại học Y Hà Nội.

4. Nguyễn Đình Thọ (2011), Giáo trình Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính.

5. Đinh Phi Hổ, Võ Văn Nhị, Trần Phước (2018), Nghiên cứu định lượng trong kế toán – kiểm toán, NXB Tài chính.