Stata学习笔记 | 基础篇2

如题所述

*学习笔记,可能存在偏差,欢迎指正。



变量相关操作有bysort,用于分组处理,例如bysort 旧变量: gen新变量=_N+1来生成新的一列变量。


order指令用于调整变量顺序,例如:order 变量1 变量2 变量3,设置所需顺序。


d命令用于基本数据介绍,describe为查看数据概况。


使用codebook 变量名可以查看变量值及标签解释。



日志使用方面,log using 文件名用于开始记录日志,建议在该步骤前使用cd更改日志位置。


log on暂停日志输入,log using 文件名, append或log using 文件名, replace实现追加或替换日志内容。


转换日志格式,通常通过文件选项完成,将SMCL转换为TXT或反之。



数据拆分流程为:首先打开需要拆分的数据,执行preserve保存当前状态,接着使用keep 变量名1 变量名2指定留下所需的变量,并保存新数据集,如save 文件1.dta, replace保存数据。


restore指令恢复原始数据状态,无需重复打开。


选择新数据集,再次使用keep 变量名1 变量名2选择另一批变量,重复保存数据,如save 文件2.dta, replace。



数据合并操作,先加载目标数据集,使用merge 1:1 变量名 using 文件2.dta进行一比一匹配合并。



数据从宽到长转换策略如下:



    保留所需变量,如keep 变量1 变量2


    重命名原有变量,例如使用rename 旧前缀* 新前缀*
    将宽数据转为长数据结构,采用reshape long 新前缀1 新前缀1, i(原编号) j(新编号),如reshape long who name age, i(id) j(family)
    删除缺失值,例如drop if 变量==.


本篇笔记旨在提供Stata操作的基础知识和技巧,希望有助于数据处理的学习与实践。

温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜