*学习笔记,可能存在偏差,欢迎指正。
变量相关操作有bysort,用于分组处理,例如bysort 旧变量: gen新变量=_N+1来生成新的一列变量。
order指令用于调整变量顺序,例如:order 变量1 变量2 变量3,设置所需顺序。
d命令用于基本数据介绍,describe为查看数据概况。
使用codebook 变量名可以查看变量值及标签解释。
日志使用方面,log using 文件名用于开始记录日志,建议在该步骤前使用cd更改日志位置。
log on暂停日志输入,log using 文件名, append或log using 文件名, replace实现追加或替换日志内容。
转换日志格式,通常通过文件选项完成,将SMCL转换为TXT或反之。
数据拆分流程为:首先打开需要拆分的数据,执行preserve保存当前状态,接着使用keep 变量名1 变量名2指定留下所需的变量,并保存新数据集,如save 文件1.dta, replace保存数据。
restore指令恢复原始数据状态,无需重复打开。
选择新数据集,再次使用keep 变量名1 变量名2选择另一批变量,重复保存数据,如save 文件2.dta, replace。
数据合并操作,先加载目标数据集,使用merge 1:1 变量名 using 文件2.dta进行一比一匹配合并。
数据从宽到长转换策略如下:
保留所需变量,如keep 变量1 变量2
本篇笔记旨在提供Stata操作的基础知识和技巧,希望有助于数据处理的学习与实践。