Uploaded by Pham Thi Hong Men

btvn tuan1

advertisement
Bài tập về nhà số 1
Nguyễn Ngọc Minh, Ma Doãn Hải
Trung tâm Nghiên cứu Chính sách và Phát triển
Tháng 3 năm 2022
Bài tập
Trong bài tập này, ta sẽ sử dụng bộ số liệu từ Khảo sát đánh giá về các khoản chi trả cho các dịch
vụ hệ sinh thái ở Ấn Độ. (Nếu bạn không hiểu các biến số và chú thích bằng tiếng Anh, xem phần
Chú thích ở dưới ).
1. Trước hết, không cần sử dụng Stata, tạo 3 thư mục: Data, Dofile, và Result. Lưu bộ số liệu
của khảo sát đánh giá về các khoản chi trả cho các dịch vụ hệ sinh thái ở Ấn Độ vào thư mục
Data.
2. Chúng ta sẽ bắt đầu với việc thiết lập do-file.
– Từ giao diện chính của Stata, mở một do-file mới.
– Hãy bắt đầu do-file với các ghi chú thông tin về (1) Người tạo do-file, (2) Dữ liệu được sử
dụng để phân tích, và (3) Mục đích của do-file.
– Thực hiện các lệnh (i) xóa nội dung trong bộ nhớ hiện tại của Stata và (ii) cho phép Stata
chạy liên tục tới kết quả cuối cùng mà không yêu cầu người dùng cuộn thông tin.
– Tạo một global tên “data” cho đường dẫn tới thư mục chứa số liệu.
– Lưu lại do-file với tên là btvn.do trong thư mục Dofile. (Gợi ý: Có thể ấn tổ hợp Ctrl/Command
+ S hoặc chọn nút “Save” ở trên cửa số Do-file Editor).
Tất cả các câu lệnh dưới đây sẽ lưu lại ở do-file.
3. Tạo ra một log file tên là btvn_1.log dưới dạng text lưu lại toàn bộ các câu lệnh và kết quả
từ các lệnh này.
4. Mở file dữ liệu “01_baseline_raw.dta” trong thư mục data. Dùng lệnh describe để có miêu
tả ban đầu về dữ liệu.
– Liệt kê một số biến được lưu dưới dạng (i) số nguyên, (ii) số thập phân và (iii) Dạng chuỗi
ký tự? (Gợi ý: Những biến dạng ký tự sẽ là có dạng str)
– Biến nào là giới tính của người trả lời, biến nào liên quan tới nghề nghiệp của người trả lời?
5. Ta sẽ tìm hiểu thêm một số thông tin về tuổi của người trả lời.
– Có bao nhiêu quan sát có giá trị biến tuổi?
– Độ tuổi trung bình của mẫu là bao nhiêu?
– Người cao tuổi nhất là bao nhiêu tuổi? Người trẻ nhất bao nhiêu tuổi?
6. Tìm hiểu thêm một số thông tin về tình trạng hôn nhân của người trả lời.
– Tỉ lệ phần trăm người trả lời đã kết hôn ở trong toàn bộ mẫu là bao nhiêu?
– Tỉnh tỉ lệ phần trăm số chủ hộ đã kết hôn là bao nhiêu?
1
7. Tạo biến trình độ học vấn của người trả lời.
– Tạo ra biến trinhdo chỉ bao gồm giá trị trống (.)
– Thay thế giá trị của biến trinhdo bằng 1 nếu người trả lời không đi học.
– Thay thế giá trị của biến trinhdo bằng 2 nếu người trả lời đã hoàn thành các lớp từ 1 tới 4.
– Thay thế giá trị của biến trinhdo bằng 3 nếu người trả lời đã hoàn thành các lớp từ 5 tới 8.
– Thay thế giá trị của biến trinhdo bằng 4 nếu người trả lời đã hoàn thành các lớp từ 9 tới
11.
– Thay thế giá trị của biến trinhdo bằng 5 nếu người trả lời hoàn thành lớp 12 hoặc chưa
hoàn thành học đại học.
– Thay thế giá trị của biến trinhdo bằng 6 nếu người trả lời hoàn thành bậc học đại học trở
lên.
– Tạo nhãn cho các giá trị của biến, tên của nhãn là trinhdo, với giá trị 1 có nhãn “Chưa đi
học", giá trị 2 có nhãn “Đi học nhưng chưa tốt nghiệp cấp 1", giá trị 3 có nhãn “Tốt nghiệp
cấp 1", giá trị 4 có nhãn “Tốt nghiệp cấp 2", giá trị 5 có nhãn “Tốt nghiệp cấp 3", và giá trị
6 có nhãn “Tốt nghiệp đại học trở lên". Dán nhãn này lên biến sau khi tạo ra.
8. Sắp xếp các quan sát chiều tăng dần của giá trị các biến quận, mã làng và mã hộ gia đình.
9. Ta sẽ tạo ra bộ số liệu chỉ giữ lại những quan sát từ 25 tới 65 tuổi. Trước hết, hãy giữ loại
những quan sát thỏa mãn điều kiện trên (hoặc bỏ đi những quan sát không thỏa mãn điều kiện).
10. Giữ lại các biến resp_id, village_id district và các biến đã sử dụng/ tạo ra từ các câu
hỏi phía trên.
11. Lưu lại bộ số liệu mới ở thư mục Result với tên là “ketqua_btvn1.dta”.
12. Đóng log-file và lưu lại do-file.
Chú thích
– resp_gender: Giới tính của người trả lời
– resp_occ_pri: Nghề nghiệp của người trả lời
– resp_age: Tuổi của người trả lời
– resp_maritalstatus: Tình trạng hôn nhân của người trả lời (Giá trị 1 - Kết hôn với một
người, giá trị 6 - Kết hôn với nhiều người)
– resp_hh_rel: Mối quan hệ với chủ hộ (Giá trị 1 - Chủ hộ)
– resp_educ: Trình độ học vấn của người trả lời ( Giá trị 0 - Không đi học; giá trị 1 đến 12:
Từ lớp 1 đến lớp 12; 13 - Học cử nhân nhưng chưa hoàn thành, 14 - Cử nhân; 15 - Học thạc
sĩ nhưng chưa hoàn thành; 16 - Thạc sĩ; 17 - Chương trình xóa mù chữ cho người lớn; 18 Chương trình xóa mù chữ khác; 19 - Hệ thống giáo dục mở)
2
Download