是r语言好用还是 stata好用

如题所述

举报该问题

推荐答案 2015-02-10

常用的 Excel、SPSS、SAS、 R语言、stata、MATLAB等 Excel SPSS 操作相对容易一些 sc-cpda 数据分析公众交流平台详细【我】资料

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WOOzzvBeeeWj7BeOjeO.html

第1个回答 2019-05-11

sysuse auto, clear
summarize mpg weight
//summarize 后面可以接一个或多个变量，个数均值最小最大值
summarize mpg, detail
//会有关于数据其他的统计指标
help summarize
tabulate mpg, sort
tabulate foreign
//最好是分类变量去tabulate,展示各个种类有多少个，占多大比例（离散的）
help tabulate
sysuse nlsw88, clear
tab occ
//不同职业的样本在我的数据库里面分别有多少个，比例大小，总的样本数量是多少
tab industry
sysuse auto, clear
tabstat mpg price weight rep78 , stat(n mean sd min median max) c(s)
//c(s)是转置过来这个矩阵，默认阅读方式是：列是统计指标，行是变量名称
help tabstat
//下划线是代表可以简写，只写c(s)
//可以规定format 总长度多少个单位，小数点前面，后面有多少个单位，统一成一个格式
tabstat mpg price weight rep78 , by(foreign) stat(n mean sd min median max) c(s)
//by是以什么分类展示

//输出表格（不要复制）：
ssc install logout
logout, save(summarize) tex word excel dec(3) replace: tabstat mpg price weight rep78 , stat(n mean sd min median max) column(s) long format
//不建议导出成tex word 因为在Excel还要进一步编辑，xml格式的可以在excel打开 rtf是可以从word打开就可以应用在论文里面了。replace替换原来的 dec（3）代表小数点后统一保留三位数，replace后面与之前一模一样，column是列
logout, save(summarize) tex word excel dec(3) replace: tabstat mpg price weight rep78 , by(foreign) stat(n mean sd min median max) c(s)

use nei_sample.dta, clear
describe
duplicates tag newid year, gen(dup)
edit newid year if dup >= 195
duplicates drop newid year, force
help merge
duplicates drop newid year, force
//一个地方会有n个企业
merge m:1 fips year using "county_na.dta"
//根据county的代码和时间调用
//有三部分的merge，merge=1和2是不需要的地方只保留3（matched）因为没有企业的观测值（0），而mrege=1则是有企业的观测值（1），而merge=2没有政策的观测值（0）（观测到了企业污染，却没有观察到关于政策的变量）
//我们关心企业所在的地区是否有环境政策

//做一个最简单的回归，政策对污染的影响：(regress)
foreach v of varlist reg_* {
replace `v'= 0 if `v' == .
}
reg co reg_co
gen lco = ln(co)
reg lco reg_co
//有0的问题
//add a set of dummies(虚拟变量）, tear , industry, county
gen fips_st = substr(fips,1,2)
//state（取fips编号的前两位）
gen sic2 = substr(sic,1,2)
//industry
gen sic1 = substr(sic2,1,1)
keep if sic1 == "2" | sic == "3"
//manufacturing only
gen lco = log(co)
//generate log
reg lco reg_co
//reg_co代表政府有无监管，有就是1（非常不准）表中的_cons代表截距
xi: reg lco reg_co i.year
//按照年份，每年加一个虚拟变量，是这一年就是一
//with year FE （根据每一年不一样回归）
bys year: egen id_sum = count(newid)
//？
xi : reg lco reg_co id_sum i.year
//with year FE, multicolinearity
//如果观测值是1996年的，那么iyear1996=1，这个统一的因素会影响所有的企业（宏观经济因素，所有企业都受影响），今年的这个企业和明年的这个企业外部环境是不一样的，是什么不重要，要capture这个东西
xi : reg lco reg_co i.year i.sic2
//with industry FE（不同产业的影响）
xi : reg lco reg_co i.year i.sic2 i.fips_st
//with state FE(省政府对环境保护的压力的影响）
xi : reg lco reg_co i.year i.sic2 i.fips
//with county FE
xtset newid year
//set panelex
xi: reg lco reg_co i.newid
//通过添加dummy
xi: xtreg lco reg_co, fe
//先进行差分（常用）
//这两行的结果相同

xi: xtreg lco reg_co i.year , fe
//year
xi: xtreg lco reg_co i.year i.fips_st, fe
//state fe
xi: xtreg lco reg_co i.year i.sic2, fe
//industry fe
//下标都是固定效益用希腊字母带下标 c是位置 j是行业 t为第t年的宏观经济形势/技术进步（系统性） i表示企业自身的固定效益，是观察不到的个体特征因素（有些企业管理水平天生高，低）
sort newid sic2
by newid: gen newsic2 = sic2[_N]
xi: xtreg lco reg_co i.newsic2, fe
//企业不更改行业属性

//two-way fised effects with firm fixed effects

xi:xtreg lco reg_co i.teay*i.newsic2, fe
//industry-year FE

xi:xtreg lco reg_co i.teay*i.fips_st, fe

findit outreg2

qui xi: xtreg lco reg_co i.year , fe
outreg2 using result.xls, excel keep(reg_co) dec(3) addtext(Firm FE, Y,Year FE,Y,State-Year FE,n,Industry-Year FE,n)
//dec(3)代表小数点后3位数导出成excel格式

qui xi: xtreg lco reg_co i.year*i.sic2 , fe
outreg2 using result.xls, excel keep(reg_co) dec(3) addtext(Firm FE, Y,Year FE,Y,State-Year FE,n,Industry-Year FE,n)

qui xi: xtreg lco reg_co i.year*i.sic2 i.year*i.fips_st , fe
outreg2 using result.xls, excel keep(reg_co) dec(3) addtext(Firm FE, Y,Year FE,Y,State-Year FE,n,Industry-Year FE,n)

17 本溪沈阳任延昊 2019/5/6 20:14:42
cd /Victor/stata
//电子地图：
findit spmap
help spmap
unicode encoding set gb18030
unicode translate "china_label.dta"
//必须先清零数据，然后运行一遍路径名才能运行这两行命令
use "china_label.dta", clear
//example 1
use china_label, clear
gen xx = uniform()
spmap xx using "china_map.dta", id(id) title("中国地图",size(*0.8)) label(label(ename) xcoord(x_coord) ycoord(y_coord) size(*.8)) plotregion(icolor(stone)) graphregion(icolor(stone)) fc(Greens) clnumber(8) oc(white ..) osize(medthin ..)
//clnumbers 代表8种不同的绿色
//example 2
tab name
replace name = subinstr(name, "省", "", .)
replace name = subinstr(name, "市", "", .)
replace name = subinstr(name, "回族自治区", "", .)
replace name = subinstr(name, "壮族自治区", "", .)
replace name = subinstr(name, "特别行政区", "", .)
replace name = subinstr(name, "自治区", "", .)
replace name = subinstr(name, "维吾尔", "", .)
tab name
//改名字
foreach x of numlist 1/5{
gen num `x'=uniform()
}
format x %9.3g
foreach x of numlist 1/5{
spmap `x' using "china_map.dta",id(id) title("中国地图", size(*0.8)) label(label(ename) xcoord(x_coord) ycoord(y_coord) size(*.8)) plotregion(icolor(stone)) graphregion(icolor(stone)) fc(Greens) clnumber(8) oc(white ..) osize(medthin ..) graph export "china0`x'.png", replace
}
cd /Victor/stata
//电子地图：
findit spmap
help spmap
unicode encoding set gb18030
unicode translate "china_label.dta"
//必须先清零数据，然后运行一遍路径名才能运行这两行命令
use "china_label.dta", clear
//example 1
use china_label, clear
gen xx = uniform()
spmap xx using "china_map.dta", id(id) title("中国地图",size(*0.8)) label(label(ename) xcoord(x_coord) ycoord(y_coord) size(*.8)) plotregion(icolor(stone)) graphregion(icolor(stone)) fc(Greens) clnumber(8) oc(white ..) osize(medthin ..)
//clnumbers 代表8种不同的绿色
//example 2
tab name
replace name = subinstr(name, "省", "", .)
replace name = subinstr(name, "市", "", .)
replace name = subinstr(name, "回族自治区", "", .)
replace name = subinstr(name, "壮族自治区", "", .)
replace name = subinstr(name, "特别行政区", "", .)
replace name = subinstr(name, "自治区", "", .)
replace name = subinstr(name, "维吾尔", "", .)
tab name
//改名字
foreach x of numlist 1/5{
gen num `x'=uniform()
}
format x %9.3g
foreach x of numlist 1/5{
spmap `x' using "china_map.dta",id(id) title("中国地图", size(*0.8)) label(label(ename) xcoord(x_coord) ycoord(y_coord) size(*.8)) plotregion(icolor(stone)) graphregion(icolor(stone)) fc(Greens) clnumber(8) oc(white ..) osize(medthin ..) graph export "china0`x'.png", replace
}

相似回答

Stata和R语言哪个好答：两个都很强大计量的用STATA多点 统计分析的用R会多点当然R现在比较多元化你画画地图什么的也能用R 主要还是看需求-(ITJOB)

面板数据分析用什么软件答：面板数据分析常用的软件有Stata、SPSS、Eviews和R语言等。详细解释如下：Stata软件：是一款专门为统计分析和数据分析而设计的软件，特别适用于面板数据分析。它提供了丰富的统计测试功能，包括固定效应、随机效应等面板数据模型的分析。此外，Stata在数据管理和数据处理方面也表现出色，非常适合社会科学、生物医学...

统计分析软件有哪些答：3. Stata：Stata是一款适用于统计和数据管理的软件，特别适用于经济学、社会学等领域的统计分析。它具有丰富的统计测试功能，并且操作界面友好。4. R语言：R语言是一种开源的统计计算软件，广泛应用于数据分析、数据挖掘、机器学习等领域。它拥有强大的统计函数库和图形功能，可以灵活地进行各种复杂的统计分...

是r语言好用还是 stata好用答：常用的 Excel、SPSS、SAS、 R语言、stata、MATLAB等 Excel SPSS 操作相对容易一些 sc-cpda 数据分析公众交流平台详细【我】资料

常用的统计软件有哪些答：3. SAS：作为功能强大的统计分析软件，它在各个领域都有广泛应用。能够处理大规模数据集，并支持高级统计分析。4. Stata：这款统计和数据分析软件适用于多种操作系统，具备强大的数据处理能力，包括数据管理和清洗，同时也提供了丰富的统计分析功能。5. R语言：作为一种开源的统计计算和软件环境，R语言在...

数据分析工具有哪几种答：3. R语言：专为统计分析和图形表示设计的编程语言，拥有丰富的统计模型和数据分析功能，以及强大的绘图能力，适合具有统计背景的用户进行高级数据分析。4. MATLAB：商业数学软件，特别适合图像处理、信号处理、工程仿真等领域，具备快速计算、良好展示效果，并有人工智能和神经网络的工具库。5. Tableau：强大...

装机必备!研究生必装6款软件奉上!答：SPSS、Stata、SAS、R语言 SPSS、Stata和SAS是专业的统计分析软件，提供从基础到高级的统计分析功能。SPSS操作简便，适合初学者；Stata功能强大，易于学习且强大；SAS则适合高级用户，提供编程能力，支持复杂的数据处理和分析。对于有编程基础的用户，R语言也是进行数据统计分析的好选择。这六款软件是研究生科研...

在R语言里调用Stata dofile答：在R语言中，如果你曾习惯使用Stata进行数据清理和分析，但转而采用R后可能遇到在R中调用Stata dofile的需求。尽管R在数据处理和可视化上更为便捷，但对Stata的计量分析用户来说，熟悉度至关重要。为解决这个问题，无需反复导出和读取数据，"RStata"包提供了一个解决方案。首先，在R中使用"RStata"包，...

请问这种带显著性标记的图怎么做?答：使用R语言进行绘图时，可以借助ggplot2、ggpubr等包，这些工具提供丰富的自定义选项，帮助用户轻松创建带有显著性标记的统计图。SAS和STATA则具有强大的数据分析和绘图功能，特别适合处理复杂数据集。在这些软件中，制作显著性标记图通常涉及指定对比组、设置显著性水平及添加显著性符号（如星号）等步骤。制作...

大家正在搜

r语言和stata哪个好用 stata与r语言 r语言怎么读取stata数据 r语言和sas哪个好学 r语言和c语言 stata replace python与r语言哪个好 r语言和sql哪个好 python和stata哪个好