

| |||||
|
|||||
|
国家统计局微观数据实验室已正式向研究人员提供微观数据开发应用服务。微观数据作为大数据的重要组成部分,是宝贵的经济和社会资源,其在政策制定和学术研究等方面起到至关重要的作用。随着经济社会研究的量化分析趋势日益凸显,研究者们也越来越依靠数据库尤其是微观数据库进行学术研究。 我校图书馆已向国家统计局成功申请了微观数据使用权限,目前开放可使用16个微观数据集,有需要的教研人员可通过登录国家统计局微观数据使用平台(https://microdata.stats.gov.cn/)按要求申请使用相关数据。 一、数据资源 (一)2012-2016年、2017-2021年规模以上工业企业财务状况年度调查微观数据 规模以上工业企业财务状况调查数据包括北京、上海、浙江三个省区的年度数据。在三个省区的规模以上工业企业中,按10%的比例随机抽取样本企业,并对企业数据进行了脱敏处理。数据包括资产负债类、损益分配类和其他三大类,主要有流动资产合计、固定资产原价、资产总计、流动负债合计、负债合计、实收资本、主营业务收入、主营业务成本、营业利润、利润总额和平均用工人数等32个指标。 (二)2005年、2008年和2010年、2013年、2015年、2017年、2020年住户收支调查微观数据 2005年、2008年和2010年城乡住户收支调查微观数据各1万户,共6万户。微观数据均已进行匿名化处理,仅保留省份信息。指标涵盖家庭基本情况、户人均收入情况、户人均消费情况、家庭基本设施等方面,城镇为40个指标,农村为32个指标。其中,农村住户调查为自加权,无权数信息。 2013年、2015年、2017年、2020年住户收支调查微观数据库为全国住户收支与生活状况调查户级样本数据。全国住户收支与生活状况调查以省为总体,综合采用分层、多阶段、与人口规模大小成比例(PPS)和随机等距抽样相结合的方法抽选村级单位和调查户。全国共抽选约16万个调查户,覆盖约1800个县(区)。数据库是对当年全国住户收支与生活状况调查数据样本户进行系统抽样获得的一个子样本,各包括2万户,共8万户。每户数据指标共32个,涵盖城乡标识、户权数、户人均可支配收入、户人均消费支出、户耐用品拥有量等。 (三)第五、六、七次全国人口普查微观数据 2000年人口普查微观数据为中国2000年人口普查个体样本数据。2000年人口普查采用了长、短两种普查表,短表包括反映人口基本状况的项目,长表包括所有短表内容和有关迁移、受教育、经济活动、婚姻家庭、生育和住房等情况的项目。长表抽取了10%的户填报,短表由其余的户填报。本数据库是对普查表长表数据进行等距抽户的方法获得,抽样比为0.95%,(样本人口1180111人,实际登记人口1242612226人)。 2010年第六次人口普查微观数据库为中国2010年人口普查个体样本数据。2010年人口普查采用了长、短两种普查表,短表包括反映人口基本状况的项目,长表包括所有短表项目和人口的经济活动、婚姻家庭、生育和住房等情况的项目。长表抽取了10%的户填报,短表由其余的户填报。本数据库是对普查表长表数据进行系统抽样获得,抽样比为0.995%,占总人口(不包含现役军人和难以确定常住地的人口)的比重为0.95‰。数据库包括户记录405660条,人记录1267381条。 2020年人口普查微观数据库根据第七次全国人口普查长表数据制作,包括户记录487998条,人记录1388302条。数据库是对普查长表数据以户为单位系统抽样获得,样本人口占全国人口(不包含现役军人)的比重为0.98‰。 (四)2015年1%人口抽样调查微观数据 2015年1%人口抽样调查微观数据库为中国2015年1%人口抽样调查个体样本数据。2015年全国1%人口抽样调查以全国为总体,以各地级市(地区、盟、州)为子总体,采取分层、二阶段、概率比例、整群抽样方法,在全国31个省、自治区、直辖市中抽取了2977个县(市、区),33671个乡(镇、街道),85365个村(居)委会的89147个调查小区。共调查登记常住人口2131万人,占全国总人口的1.55%。数据库使用常住人口口径,数据指标涵盖姓名、性别、年龄、民族、户籍情况、受教育程度、行业、职业、迁移流动、社会保障、婚姻、生育、死亡、住房情况等60个相关指标。 (五) 第三次、第四次全国经济普查微观数据 第三次全国经济普查微观数据是对第三次全国经济普查中的全部企业法人单位抽样取得,不包含金融和铁路系统单位,按照10%的比例进行抽样。为防止个人特征的泄漏,数据库已进行匿名化处理。数据分非工业企业、规模以下工业企业、规模以上工业企业三部分。 第四次全国经济普查微观数据集抽取对象为普查的企业法人单位,不包括非企业单位,在企业法人单位中不包括农林牧渔业、金融业和铁路运输业单位。按照规模以上工业企业法人单位、规模以下工业企业法人单位、除工业外的其他企业法人单位三部分,分别采取10%的比例进行抽取。根据不同行业特点有重点地抽取指标,共抽取了83个指标。 (六)第三次全国农业普查微观数据 第三次全国农业普查微观调查数据包括农业经营单位普查微观数据、农业经营户普查微观数据、农户普查微观数据、行政村普查数据和乡镇普查微观数据。 (七)2018年全国时间利用调查微观数据 2018年全国时间利用调查微观数据库是2018年全国时间利用调查个体样本数据,调查对象共48580人。微观数据已进行匿名化处理,以“家庭编码+人码”对个体进行标识,其中家庭编码为20位,已做脱敏处理以确保无法识别调查对象地理位置且每一户编码唯一。指标涵盖城乡、性别、出生年月、民族、受教育程度等基本信息和一天24小时活动时间和活动内容情况等。 (八)2014-2016年企业跟踪调查季度数据 本微观数据库数据来源于2014年3季度至2016年4季度,国家统计局会同原国家工商总局从工商登记制度改革实施后在工商行政管理部门新登记注册的小微企业和个体经营户中,抽取部分样本单位,按季度开展跟踪调查的数据。数据指标有9个,包括单位基本情况、经济指标和问卷指标三大类,主要有行业代码、企业个体标识、资产总计、营业收入、从业人员期末人数、本季度的经营情况、本季度用工情况、本季度享受优惠政策情况、最关注的政策措施。 二、申请流程 我校已加入国家统计局微观数据开发应用对象白名单,校内教研人员可直接进行数据申请,步骤如下: 1.填写《微观数据使用申请表》提交审核,审核通过后,研究人员按预约时间前往相应实验室使用微观数据。如有延长数据使用期限、增加使用数据集、添加研究人员等需要,研究人员需填写《微观数据使用变更申请表》;如因特殊原因需更换实验室,研究人员需填写《微观数据实验室变更申请表》(仅限中间成果带离前)。 2.中间成果带离。数据使用阶段结束后,研究人员需将形成的文字描述、图表内容及模型结论等成果按照规定文档格式(原则上内容不得超过5页)上传至指定位置,提出带离申请,经实验室管理人员登记确认后带离。 3.最终成果审核。在中间成果基础上进行文字加工形成的正式稿件或著作等,研究人员需填写《微观数据最终成果审核表》,经审核后可以期刊、网站、授课、演讲等形式发布。 4.最终成果登记。研究人员发布最终成果后,应当填写《微观数据最终成果登记表》,提交至微观数据实验室。 三、其他须知 1.填表时请选择正确的机构名称:四川农业大学,登陆账户和登陆密码需自行设置,用于后期到清华大学微观数据实验室查找数据时使用,其他内容根据个人研究计划填写。 2.填写表格后提交,系统将自动生成Word申请表,研究人员需按提示将申请表下载打印,签字盖章上传电子版至国家统计局微观数据申请系统,电脑自动反馈四位数查询码。 3.申请结果审核通过后,可凭“登陆名”和“登陆密码”至清华大学舜德楼224室使用数据。 |
电子资源版权说明: 图书馆所购电子资源,仅限于在四川农业大学校园网IP范围内用户使用。为了保护电子资源的知识产权,维护四川农业大学的声誉,也为了保证广大合法用户的正当权益,图书馆要求各使用单位和个人重视并遵守电子资源知识产权的有关规定。 1.严禁任何个人或单位连续、系统、集中、批量地下载图书馆购买或试用的电子资源,更不能使用网络下载工具批量下载。 2.图书馆收录的研究生论文(含电子版及纸质版)仅限校内保存与查询,特此说明。 3.不得将所获得的电子资源提供给校外人员,不得将个人网络帐号提供给校外人员使用本校电子资源,更不允许利用获得的电子资源进行非法牟利。 4.校内任何个人不得设置代理服务器阅读或下载电子资源。校内单位若由于特殊需要需设置代理服务器,一定要事先得到图书馆允许,并且保证该服务器不得允许校园外IP通过它访问图书馆购买的电子资源。 5.读者有义务妥善保管个人网络账号及电脑(服务器)。如出现账号被盗、电脑受攻击等情况而造成了电子资源的违规使用,读者将承担相应责任。 6.如发现违规行为,图书馆将协助学校有关部门进行追查,并进行如下处理: (1)通知所在单位,并限违规当事人于3个工作日内到图书馆接受调查并提交书面检讨,图书馆向全校范围发布通报批评。 (2)停止借书权限半年。 (3)情节严重者,将报请学校予以纪律处分。由此而引起的一切后果由违规者自负。 说明:由于各数据库商对“批量下载”的界定不一致,因此图书馆无法制订统一标准。一般数据库商认为,如果超出正常阅读速度下载文献就视为“批量下载”,通常正常阅读一篇文献的速度至少需要几分钟。 请广大读者协助监督,如果发现违规行为,请向图书馆信息技术部举报。
|