第1个回答 2025-03-11
Stata基础学习笔记要点:
变量相关操作:
bysort:用于分组处理,例如bysort 旧变量: gen 新变量=_N+1,可以生成新的一列变量。order:调整变量顺序,如order 变量1 变量2 变量3,按指定顺序排列变量。d与describe:d命令为基本数据介绍快捷命令,describe用于查看数据概况。codebook:使用codebook 变量名查看变量值及其标签解释。
日志使用:
log using 文件名:开始记录日志,建议在开始前使用cd命令更改日志保存位置。log on:暂停日志输入。log using 文件名, append或log using 文件名, replace:分别用于追加或替换日志内容。日志格式转换:通常通过文件选项完成,如将SMCL格式转换为TXT格式或反之。
数据拆分:
preserve:保存当前数据状态,便于后续恢复。keep 变量名1 变量名2:指定需要保留的变量。save 文件名.dta, replace:保存新数据集,replace选项用于覆盖同名文件。restore:恢复原始数据状态,无需重新打开数据。
数据合并:
merge 1:1 变量名 using 文件2.dta:进行一比一匹配合并,适用于两个数据集间的合并操作。
数据从宽到长转换:
keep 变量1 变量2:保留所需变量。rename 旧前缀* 新前缀*:重命名变量,用于转换前的准备。reshape long 新前缀1 新前缀2, i j:将宽数据转为长数据,i指定行标识变量,j指定新变量的编号。drop if 变量==.:删除缺失值,确保数据完整性。