mercredi 23 mai 2018

SAS Stratified Sampling

I have an example of PROC SURVEYSELECT where I created four groups containing five IDs in each group. I want to be able to take a random sample where the IDs in different stratifications (i.e. groups) do not overlap. How can I accomplish this? Note that each group has the same repeating ID - 1 and 2. The next three IDs are unique to the group.

Example code:

data survey;
input group $ id;
datalines;
a 1
a 2
a 3
a 4
a 5
b 1
b 2
b 6
b 7
b 8
c 1
c 2
c 9
c 10
c 11
d 1
d 2
d 12
d 13
d 14
;


proc surveyselect data=survey
method=srs n=3
out=MyStratExample;
strata group;
run;

proc print data=MyStratExample;
run;

current output:

a   1   0.6 1.6666666667
a   3   0.6 1.6666666667
a   4   0.6 1.6666666667
b   1   0.6 1.6666666667
b   2   0.6 1.6666666667
b   7   0.6 1.6666666667
c   1   0.6 1.6666666667
c   2   0.6 1.6666666667
c   11  0.6 1.6666666667
d   1   0.6 1.6666666667
d   2   0.6 1.6666666667
d   13  0.6 1.6666666667

We can observe that across the multiple groups SAS is taking samples of the same ID variable.




Aucun commentaire:

Enregistrer un commentaire