Phương Pháp Thu Thập Thông Tin Trong Nghiên Cứu Khoa Học

Giới thiệuBộ máy tổ chức Đào tạoDạy nghềTài liệu chuyên môn Nghiên cứu khoa học Hợp tác-Đối ngoại Tìm kiếm thông tin Lịch công tác

Phương pháp thu thập số liệu trong Nghiên cứu khoa học

Phương pháp thu thập số liệu thực nghiệm, phi thực nghiệm, cách xác định cỡ mẫu và hướng dẫn thiết kế mẫu điều tra...

Bạn đang xem: Phương pháp thu thập thông tin trong nghiên cứu khoa học


Phương pháp thu thập số liệu từ tham khảo tài liệu

Phương pháp nầy là dựa trên nguồn thông tin sơ cấp và thứ cấp thu thập được từ những tài liệu nghiên cứu trước đây để xây dựng cơ sở luận cứ để chứng minh giả thuyết. Thí dụ, để chứng minh giả thuyết “không thể loại bỏ cây bạch đàn ra khỏi cơ cấu cây trồng rừng”, người ta đã dựa vào những nghiên cứu có trước như sau (Vũ Cao Đàm, 2003):

Kết quả nghiên cứu tại Nga cho thấy, chỉ trong 15 năm bạch đàn có sức tăng trưởng chiều cao gấp 5 lần so với cây dẻ và 10 lần so với cây sồi; Sản lượng bạch đàn trên 1 ha hàng năm rất cao, tới 20 đến 25 m3/ha/năm, trong khi cây mỡ chỉ đạt 15-20 m3/ha/năm và cây bồ đề là 10-15 m3/ha/năm; Theo thống kê của FAO, từ năm 1.744 đến 1.975 đã có hơn 100 nước nhập khẩu bạch đàn, trong đó có 78 nước đã trồng rừng bạch đàn thành rừng kinh tế có sản lượng cao với qui mô lớn.
Phương pháp thu thập số liệu từ những thực nghiệm

Khái niệm

Trong phương pháp nầy, số liệu được thực hiện bằng cách quan sát, theo dõi, đo đạc qua các thí nghiệm. Các thí nghiệm trong lĩnh vực khoa học tự nhiên, vật lý, hóa học, kỹ thuật, nông nghiệp, kể cả xã hội thường được thực hiện trong phòng thí nghiệm, nhà lưới, ngoài đồng và cộng đồng xã hội. Để thu thập số liệu, các nhà NCKH thường đặt ra các biến để quan sát và đo đạc (thu thập số liệu). Các nghiệm thức trong thí nghiệm (có những mức độ khác nhau) thường được lặp lại để làm giảm sai số trong thu thập số liệu.

Ví dụ: Người nghiên cứu muốn xem xét những mức độ phân bón (hay còn gọi nghiệm thức phân bón) nào đó để làm tăng năng suất, trong cách bố trí thí nghiệm thì mỗi mức độ phân bón thường được lặp lại nhiều lần. Kết quả thí nghiệm là các số liệu được đo từ các chỉ tiêu sinh trưởng và năng suất ở những mức độ phân bón khác nhau.

Phương pháp khoa học trong thực nghiệm gồm các bước như: lập giả thuyết, xác định biến, bố trí thí nghiệm, thu thập số liệu để kiểm chứng giả thuyết.


Định nghĩa các loại biến trong thí nghiệm

Trong nghiên cứu thực nghiệm, có 2 loại biến thường gặp trong thí nghiệm, đó là biến độc lập (independent variable) và biến phụ thuộc (dependent variable).

Biến độc lập (còn gọi là nghiệm thức):là các yếu tố, điều kiện khi bị thay đổi trên đối tượng nghiên cứu sẽ ảnh hưởng đến kết quả thí nghiệm. Như vậy, đối tượng nghiên cứu chứa một hoặc nhiều yếu tố, điều kiện thay đổi. Nói cách khác kết quả số liệu của biến phụ thuộc thu thập được thay đổi theo biến độc lập.

Thí dụ:

Biến độc lập có thể là liều lượng phân bón, loại phân bón, lượng nước tưới, thời gian chiếu sáng khác nhau,… (hay còn gọi là các nghiệm thức khác nhau).

Trong biến độc lập, thường có một mức độ đối chứng hay nghiệm thức đối chứng (chứa các yếu tố, điều kiện ở mức độ thông thường) hoặc nghiệm thức đã được xác định mà người nghiên cứu không cần tiên đoán ảnh hưởng của chúng. Các nghiệm thức còn lại sẽ được so sánh với nghiệm thức đối chứng hoặc so sánh giữa các cặp nghiệm thức với nhau .

Biến phụ thuộc (còn gọi là chỉ tiêu thu thập): là những chỉ tiêu đo đạc và bị ảnh hưởng trong suốt quá trình thí nghiệm, hay có thể nói kết quả đo đạc phụ thuộc vào sự thay đổi của biến độc lập. Thí dụ: khi nghiên cứu sự sinh trưởng của cây mía, các biến phụ thuộc ở đây có thể bao gồm: chiều cao cây, số lá, trọng lượng cây,… và kết quả đo đạc của biến phụ thuộc ở các nghiệm thức khác nhau có thể khác nhau.

Thí dụ:

Đề tài: “Ảnh hưởng củaliều lượng phân Ntrênnăng suất lúaHè Thu” có các biến như sau:

+Biến độc lập: liều lượng phân N bón cho lúa khác nhau. Các nghiệm thức trong thí nghiệm có thể là 0, 20, 40, 60 và 80 kgN/ha. Trong đó nghiệm thức “đối chứng” không bón phân N.

+Biến phụ thuộc: có thể là số bông/m2, hạt chắt/bông, trọng lượng hạt và năng suất hạt (t/ha).


Xác định các biến trong thí nghiệm dựa trên mối quan hệ “nhân-quả” của giả thuyết

Kết quả quan sát lệ thuộc vào nguyên nhân gây ảnh hưởng. Dựa vào mối quan hệ trong giả thuyết đặt ra, người nghiên cứu dễ dàng xác định được yếu tố nào ảnh hưởng đến sự kiện quan sát. Thí dụ, “Ảnh hưởng củanồng độ NAAtrênsự đậu tráicủa xoài Cát Hòa Lộc”. Ở đây, tỷ lệ đậu trái (kết quả) khác nhau là do ảnh hưởng của các nồng độ NAA (nguyên nhân) khác nhau. Như vậy, biến độc lập là biến mà người nghiên cứu có ý định làm thay đổi (nồng độ NAA khác nhau) và biến phụ thuộc ở đây là sự đậu trái hay tỷ lệ rụng trái ở các nghiệm thức có nồng độ NAA khác nhau.


Bố trí thí nghiệm để thu thập số liệu nghiên cứu


Đối tượng khảo sát

Để chọn đối tượng khảo sát trong thí nghiệm, công việc đầu tiên là phải xác định quần thể (population) mà người nghiên cứu muốn đo đạc để thu thập kết quả. Một quần thể bao gồm nhiều cá thể mang các thành phần và đặc điểm khác nhau mà ta muốn khảo sát. Đối tượng khảo sát thường được chia làm hai nhóm:

a) Nhóm khảo sát:đối tượng được đặt ra trong giả thuyết.

b) Nhóm đối chứng: so sánh với nhóm khảo sát.


Khung mẫu (sample frame)

Để bố trí và thu thập số liệu thí nghiệm nghiên cứu thì công việc trước tiên là thiết lập khung mẫu. Khung mẫu cần xác định các cá thể trong quần thể mục tiêu (target population), cỡ mẫu và phương pháp lấy mẫu.

Trong trường hợp thiết lập khung mẫu sai thì mẫu chọn sẽ không đại diện cho quần thể mục tiêu và số liệu thu thập sẽ không đại diện cho quần thể. Có ba trường hợp tạo ra khung mẫu sai:

Khung mẫu chứa quá nhiều cá thể, mà trong đó có cá thể không nằm trong quần thể mục tiêu. Khung mẫu chứa quá ít cá thể, mà trong đó có cá thể nằm và không nằm trong quần thể mục tiêu. Khung mẫu chứa tập hợp các cá thể không đúng hay khung mẫu không nằm trong quần thể mục tiêu.

Hai giai đoạn tạo khung mẫu:

Xác định các cá thể trong quần thể mục tiêu và cỡ mẫu. Thí dụ, cỡ mẫu của 100 hộ gia đình ở thành phố và 150 gia đình ở nông thôn. Chọn phương pháp lấy mẫu ngẫu nhiên hoặc không ngẫu nhiên. Thí dụ: trong nghiên cứu điều tra, mẫu ngẫu nhiên thì vị trí chọn mẫu có thể dựa vào bản đồ ranh giới giữa các vùng, lập danh sách hộ gia đình theo số nhà, danh bạ điện thoại nếu có, … sau đó chọn phương pháp lấy mẫu.

Phương pháp lấy mẫu

Trước khi đi vào chi tiết về phương pháp lấy mẫu, cần hiểu các định nghĩa có liên quan đến phương pháp, trình bày trong Bảng 5.1.

Bảng 5.1Các định nghĩa có liên quan đến phương pháp lấy mẫu

Quần thể(population) Một tập hợp các đối tượng khảo sát (người, cá thể, nhân vật, sinh vật,…) và chứa các đặc tính cần nghiên cứu hay khảo sát.
Quần thể mục tiêu(target population) Mang đặc tính nào đó và được đánh giá qua mẫu; hoặc mang các đặc tính cần nghiên cứu và đại diện cho toàn quần thể. Thí dụ, khi nghiên cứu về việc sử dụng các bếp lò nấu ăn, thì quần thể mục tiêu hầu hết là người phụ nữ.

Xem thêm: Top 3 Phần Mềm Check Mã Vạch Tốt Nhất Hiện Nay, Top 5 Phần Mềm Check Mã Vạch Tốt Nhất

Mẫu (sample) Một phần hoặc tập hợp nhỏ cá thể của quần thể mục tiêu được chọn đại diện cho quần thể để khảo sát nghiên cứu.
Mẫu không xác suất (non-probability sample) Phương pháp trong đó việc chọn mẫu không có xác suất đồng đều hay các cá thể trong quần thể không có cơ hội được chọn như nhau.
Mẫu xác suất (probability sample) Phương pháp chọn mẫu trong đó mỗi cá thể có một xác suất đặc trưng của mẫu và thường bằng nhau. Hầu hết việc lấy mẫu xác suất sử dụng cách lấy mẫu ngẫu nhiên để tạo ra mỗi cá thể trong quần thể có cơ hội được chọn như nhau.

Mục đích của tất cả các phương pháp lấy mẫu là đạt được mẫu đại diện cho cả quần thể nghiên cứu. Khi chọn phương pháp lấy mẫu thì cần hiểu rõ các đặc tính của quần thể nghiên cứu để xác định cỡ mẫu quan sát đại diện và để đánh giá tương đối chính xác quần thể.

Trong nghiên cứu, không thể quan sát hết toàn bộ các cá thể trong quần thể, mà chỉ chọn một số lượng đủ các cá thể đại diện hay còn gọi là mẫu thí nghiệm. Phương pháp chọn mẫu thí nghiệm rất quan trọng, bởi vì có liên quan tới sự biến động hay độ đồng đều của mẫu. Có hai phương pháp chọn mẫu: (1) Chọn mẫu không xác suất (không chú ý tới độ đồng đều) và (2) chọn mẫu xác suất (đề cập tới độ đồng đều).

* Chọn mẫu không có xác suất

Phương pháp chọn mẫu không xác suất là cách lấy mẫu trong đó các cá thể của mẫu được chọn không ngẫu nhiên hay không có xác suất lựa chọn giống nhau. Điều này thể hiện trong cách chọn mẫu như sau:

Các đơn vị mẫu được tự lựa chọn mà không có phương pháp. Các đơn vị mẫu rất dễ dàng đạt được hoặc dễ dàng tiếp cận. Thí dụ chọn những hộ trên những con đường dễ đi. Các đơn vị mẫu được chọn theo lý do kinh tế, thí dụ trả tiền cho sự tham dự. Các đơn vị mẫu được quan tâm bởi người nghiên cứu trong cách “điển hình” của quần thể mục tiêu. Thí dụ người nghiên cứu chỉ quan tâm đến các nhân vật điển hình trong quần thể nghiên cứu, để so sánh với các nhân vật khác. Các đơn vị mẫu được chọn mà không có sự thiết kế rõ ràng (thí dụ: chọn 50 người đầu tiên đến buổi sáng).

Phương pháp chọn mẫu không có xác suất thường có độ tin cậy thấp. Mức độ chính xác của cách chọn mẫu không xác suất tùy thuộc vào sự phán đoán, cách nhìn, kinh nghiệm của người nghiên cứu, sự may mắn hoặc dễ dàng và không có cơ sở thống kê trong việc chọn mẫu.

* Chọn mẫu xác suất

Cơ bản của việc chọn mẫu xác suất là cách lấy mẫu trong đó việc chọn các cá thể của mẫu sao cho mỗi cá thể có cơ hội lựa chọn như nhau, nếu như có một số cá thể có cơ hội xuất hiện nhiều hơn thì sự lựa chọn không phải là ngẫu nhiên. Để tối ưu hóa mức độ chính xác, người nghiên cứu thường sử dụng phương pháp lấy mẫu ngẫu nhiên.

* Các phương pháp chọn mẫu ngẫu nhiên

- Chọn mẫu ngẫu nhiên đơn giản(simple random)

Cách đơn giản nhất của việc chọn các cá thể của mẫu trong cách chọn mẫu ngẫu nhiên là sử dụng xác suất. Việc lựa chọn n các cá thể từ một quần thể sao cho các cá thể có cơ hội bằng nhau hay một xác suất bằng nhau trong phương pháp nầy. Thí dụ: Một trường học có 1.000 sinh viên, người nghiên cứu muốn chọn ra 100 sinh viên để nghiên cứu về tình trạng sức khỏe trong số 1.000 sinh viên. Theo cách chọn mẫu đơn giản thì chỉ cần viết tên 1.000 sinh viên vào trong mẫu giấy nhỏ, sau đó bỏ tất cả vào trong một cái thùng và rồi rút ngẫu nhiên ra 100 mẫu giấy. Như vậy, mỗi sinh viên có một cơ hội lựa chọn như nhau và xác suất chọn ngẫu nhiên một sinh viên trên dễ dàng được tính. Thí dụ trên ta có quần thể N = 1.000 sinh viên và cỡ mẫu n = 100 sinh viên. Như vậy, sinh viên của trường được chọn trong cách lấy mẫu ngẫu nhiên sẽ có xác suất là n/(N x 100) hay 100/(1000 x 100) = 10%.

Một cách chọn mẫu ngẫu nhiên khác là sử dụng bảng số ngẫu nhiên trong sách thống kê phép thí nghiệm hoặc cách chọn số ngẫu nhiên bằng các chương trình thống kê trên máy tính.

Phương pháp chọn mẫu ngẫu nhiên trong các thí nghiệm lấy mẫu trong thực tế được thể hiện trong hình 5.1.

*

Để áp dụng kỹ thuật chọn mẫu phân lớp thì trước tiên người nghiên cứu cần nắm các thông tin và các số liệu nghiên cứu trước đây có liên quan đến cách lấy mẫu phân lớp. Sau đó, người nghiên cứu sẽ xác định cỡ mẫu và chọn ngẫu nhiên các cá thể trong mỗi lớp.

Thí dụ: khi nghiên cứu về mức độ giàu nghèo của một vùng nghiên cứu có 4 huyện (4 phân lớp), mỗi huyện có số hộ gia đình khác nhau được biết trong Bảng 5.2. Người nghiên cứu muốn thực hiện 200 cuộc phỏng vấn hộ gia đình trong vùng nghiên cứu, như vậy cỡ mẫu của mỗi huyện sẽ được tính theo tỷ lệ phần trăm trong Bảng 5.2 như sau:

BảngThí dụ về cách chọn mẫu phân lớp

Huyện Số hộ trong mỗi lớp Tỷ lệ hộ trong mỗi lớp (%) Cỡ mẫu phỏng vấn ỡ mỗi lớp
A 250 25 50
B 150 15 30
C 400 40 80
D 200 20 40
1000 100 200

Nếu như số hộ của 4 huyện gần như nhau, người nghiên cứu chỉ cần chọn 50 cuộc phỏng vấn trong mỗi huyện và sau đó chọn mẫu ngẫu nhiên trong mỗi lớp.

Cũng trong nghiên cứu trên, nếu người nghiên cứu không phân chia các huyện ra thành các lớp, thì phương pháp lấy mẫu ngẫu nhiên phỏng vấn hộ gia đình trong vùng nghiên cứu sẽ sai và số liệu thu thập sẽ không đại diện cho vùng nghiên cứu, do mẫu có thể tập trung ở một huyện nào đó.

Một số nghiên cứu thường được chia lớp trong quần thể mục tiêu gồm:

Phân lớp quần thể mục tiêu là các thành phố, tỉnh, huyện; phân lớp theo vùng sinh thái khác nhau; phân lớp quần thể mục tiêu là các hộ gia đình theo mức độ giàu nghèo, trình độ học vấn, …; …

Trong phương pháp chọn mẫu phân lớp, các quần thể phụ là các vùng chia phụ hay các lô được chia trong Hình 5.2 khi đã xác định các yếu tố như loại đất, dạng đời sống thực vật hoặc dạng địa hình, … Các điểm được chọn ngẫu nhiên trong mỗi vùng phụ được thể hiện trong Hình 5.2.

*

Hình 5.3 Phương pháp chọn mẫu hệ thống

- Chọn mẫu chỉ tiêu(quota sampling)

Trong cách chọn mẫu chỉ tiêu, quần thể nghiên cứu được phân nhóm hoặc phân lớp như cách chọn mẫu phân lớp. Các đối tượng nghiên cứu trong mỗi nhóm được lấy mẫu theo tỷ lệ đã biết và sau đó tiến hành phương pháp chọn mẫu không sác xuất. Để thiết lập mẫu chỉ tiêu thì người nghiên cứu cần phải biết ít nhất các số liệu, thông tin trong quần thể mục tiêu để phân chia các chỉ tiêu muốn kiểm soát. Thí dụ, một cuộc phỏng vấn để biết được hoạt động hoặc lý do khách du lịch đến Cần thơ. Dựa trên số liệu nghiên cứu trước đây hoặc số liệu điều tra dân số cho biết lý do khách du lịch tới Cần thơ như sau: 60% với lý do đi nghĩ mát, vui chơi; 20% lý do thăm bạn bè, gia đình; 15% lý do kinh doanh và 5% lý do hội họp. Người nghiên cứu dự tính cỡ mẫu muốn phỏng vấn 500 khách du lịch, và chọn những nơi có nhiều khách du lịch như khách sạn, nơi hội họp, khu vui chơi giải trí,… Như vậy tỷ lệ mẫu để muốn phỏng vấn đạt được cho mỗi lý do (chỉ tiêu) nêu trên sẽ tương ứng tỷ lệ là 300, 100, 75 và 25 khách du lịch. Nếu như chỉ tiêu 300 khách du lịch đến với lý do vui chơi, giải trí được trả lời chưa đủ thì phải tiếp tục phỏng vấn cho tới khi đạt được đủ chỉ tiêu.

Thuận lợi của lấy mẫu chỉ tiêu áp dụng trong một vài nghiên cứu là chi phí thực hiện nghiên cứu tương đối rẽ và dễ (do không cần phải thiết lập khung mẫu). Bất lợi của việc chọn mẫu chỉ tiêu là không đại diện toàn bộ quần thể, do lấy mẫu không xác suất như chọn ưu tiên phỏng vấn khách du lịch đến trước, chọn nơi có nhiều khách lui tới, khách ở khách sạn, ... và vì vậy mức độ tin cậy phụ thuộc vào kinh nghiệm hay sự phán đoán của người nghiên cứu và sự nhiệt tình của người trả lời phỏng vấn.

Để tăng mức độ tin cậy, người nghiên cứu cần thực hiện cuộc phỏng vấn bước đầu để kiểm tra người trả lời có rơi vào các chỉ tiêu hay không. Chọn mẫu chỉ tiêu ít được áp dụng trong các nghiên cứu phát triển, nhưng đôi khi đựoc sử dụng trong một vài nghiên cứu nhỏ mang các đặc tính quan sát.

* Chọn mẫu không gian(spatial sampling)

Người nghiên cứu có thể sử dụng cách lấy mẫu nầy khi hiện tượng, sự vật được quan sát có sự phân bố mẫu theo không gian (các đối tượng khảo sát trong khung mẫu có vị trí không gian 2 hoặc 3 chiều). Thí dụ lấy mẫu nước ở sông, đất ở sườn đồi, hoặc không khí trong phòng. Cách chọn mẫu như vậy thường gặp trong các nghiên cứu sinh học, địa chất, địa lý.

Lấy mẫu theo sự phân bố này yêu cầu có sự giống nhau về không gian qua các phương pháp ngẫu nhiên, hệ thống và phân lớp. Kết quả của một mẫu chọn có thể được biểu diễn như một loạt các điểm trong không gian hai chiều, giống như là bản đồ.