语言: English
大数据平台Big Data
抽样方法与样本
您当前的位置: 首页 > 大数据平台 > 抽样方法与样本

华中农业与农村发展调研抽样方案


 华中农业与农村发展调研采用分层抽样与随机抽样相结合的方式,在河南、湖北、湖南三省各抽取360个农户,各省的县、乡、(行政)村、农户四个层次的抽样数量如表1所示:


1 华中三省各级样本数量


河南 湖北 湖南
县级样本数 6 6 6
乡级样本数 3 3 3
村级样本数 2 2 2
农户样本数 10 10 10
样本农户数量合计 360 360 360


一、抽取县市

1、分层抽样

 采用中国县域统计年鉴2017年数据(反映2016年情况)分别对河南、湖北和湖南三省所辖全部县级行政单位通过聚类分析分为6个聚类。聚类分析采用k-means clustering方法,依据反映乡镇人口、土地、经济与农业产出四个方面情况的指标进行,具体如表2所示:


2 县级样本聚类分析所用指标

编号 指标
1 行政区域面积
2 乡镇总和
3 户籍人口
4 第一产业从业人数
5 地区生产总值
6 第一产业增加值
7 粮食总产量


2、随机抽样

 先在各类中随机抽取2个县市,在各类中的县市不出现空间位置上和经济发展水平(地区生产总值)排名邻近的情况下,在各类中选择1个县市。


二、抽取乡镇

1、分层抽样

 首先排除个别农业经济比重很低以致于其农业经济社会发展水平的代表性很弱的乡镇(如城关镇),以及已规划其行政区划将被改变(如被合并)以致于经济社会数据统计口径难以一致的乡镇,然后依据与抽取样县市基本一致的指标(如表3所示)运用2016年或2017年数据(取决于数据可得性)进行k-means聚类分析,将所有的乡镇分为三个聚类。


3 乡级样本聚类分析所用指标

编号 指标
1 行政区域面积
2 农业人口
3 地区生产总值
4 耕地面积/作物播种面积
5 农业生产总值
6 粮食作物总产量


2、随机抽样

 在每一类的乡镇中先随机抽取两个乡镇,在各类中的乡镇不出现空间位置上和经济发展水平(地区与农业生产总值)排名邻近的情况下,在各类中随机选择1个乡镇。


三、抽取行政村

 由于一般无法获得行政村层面的统计数据,难以进一步实施聚类分析。采用熟悉各个行政村经济社会总体发展水平的工作人员的意见,抽取一个经济社会发展水平相对差异较大、且地理位置上不邻近的两个行政村。


四、抽取农户

 获取行政村全部农户的名单,以土地面积30亩为界将农户分为种养大户和普通农户。在大户中随机抽取5户,其中任选3户在本次调研中使用、其余2户备用;在普通农户中随机抽取10户,其中任选7户在本次调研中使用、其余2户备用(如表4所示)。


4 大户和普通农户样本抽取数量


抽取数量 使用数量 备用数量
大户抽取 5 3 2
普通农户抽取 10 7 3


 从行政村随机抽取农户的操作方法如下(以抽取普通农户为例,抽取大户的方法相同):


 1、在能够获得农户电子名单的情况下,采用生成随机数的方法进行。如果农户总数为n,则在1n之间生成10个随机数(如用Excel生成),抽取排列顺序为这些随机数的农户。如果这些农户中有大于3户不能参与调研,则重新生产10个随机数,直到其中不能参与调研的农户少于3户为止。


 2、在不能获得农户电子名单的情况下,采用等距抽样的方法进行。如果农户总数为n,需要抽取10个农户,先将全部农户分为10个层次,每个层次包含n/10户;然后决定一个在各个层次中抽取农户的固定位置,按这一固定位置在每个层次中抽取1个农户。如选择第2个作为固定位置,则在每个层次中都抽取第2个农户,如果在某个层次中,该固定位置上的农户不能参与调研,则顺延至下一个位置(如从第2个顺延至第3个),以此类推。如此操作,每个层次抽取1个农户,最终抽出10个农户。