本文重点
利用PROC SURVEYSELECT抽样
其一般形式是:
PROC SURVEYSELECT
data=<源数据集名
>
method
=
out=<抽取样本存放的数据集
>
n
=<抽取数量
>(or samprate
=抽样比例
)
seed
=n
;
strata
<指定分层变量
>;
id
<指定抽取的样本所保留的源数据集变量
>;
run
;
说明: 1. method用来指定随机抽样方法的 a. SRS是指不放回简单随机抽样(Simple Random Samping); b. urs是指放回简单随机抽样(Unrestricted Random Sampling); c. sys是指系统抽样(Systematic Sampling)。 2. seed用来指定随机种子数,为非负整数 a. 取0则每次抽取的样本不同 b. 若取大于0的整数,则下次抽样时若输入相同值即可得到相同的样本; 3. id是指定从源数据集复制到样本数据集的变量,若缺省,则复制所有变量。