1、查看stata自带的数据库,使用命令sysuse dir,结果如下图

2、接下来我们使用 uslifeexp.dta作为例子。sysuse uslifeexp

3、用describe命令了解此数据库的简要信息。比如:样本数量(obs:100、变量墙绅褡孛数量(vars:10)、大小(size:3800)等。

4、从describe中可以看出le是其中的一个变量,用codebook查看此变量详细信息。

5、通过summarize命令了解le变量的几个统计量。例如,它的平均值、最大值、最小值、标准差等。

6、如果想要更详细的统计信息,可以带detail参数。

7、用茎叶图探索变量le的分布 stem le

8、用箱式图探索变量le的分布(graph box le)

9、用直方图探索变量le的分布(hist le)
