微观数据库(经济学论文的葵花宝典)作者: 游跏
鄙人最近被计量论文的数据来源折磨的死去活来,光是为了找面板数据就找了两天有余。在询问了各位大牛、大神、大仙,终于苦尽甘来,基本上以后找数据都不用愁了。独乐乐不如众人乐,现在把每个数据库的特点和链接整理如下,以馈大众(尤其是广大基地长期被论文压迫的童鞋),请仔细浏览本文,你失去的只有几分钟,得到的是整个免费数据,大家尽情转载、随处复制吧。(特此感谢基地大牛超姐、人大坛友zera及我国非著名经济学家杜牛牛对本人的指导)
1. UHS (Urban Household Survey)(此数据使用需要得到国家统计局授权)
简介:中国城镇住户调查数据。它是国家统计局城调总队负责调查的。现在可以拿到1986年至2006年的数据。如果可能的话,我们可以拿到全部省份的数据,但现在大家使用的是六个省份的数据(北京、广东、浙江、辽宁、陕西、四川)。每年大约有3500-4000户的数据。
包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、文化程度、行业、职业、就业状况、工资、总收入、工作小时数、参加工作年份、退休金、财产性收入。(2)家庭层次上的变量。家庭总收入、家庭人口数、居住面积、房间个数、家庭财产、现金支出、现金流入、储蓄、借款、家庭消费。
可做的研究:
(1)教育回报率问题。
(2)收入不平等问题。
(3)劳动力供给问题。家庭财产、孩子(老人)、退休金。
(4)行业的分布及变化。
(5)职业的分布及变化。人力资源管理。
(6)就业问题。失业率和劳动参与率。
(7)教育决定因素及教育不平等问题。
(8)社会保障方面的研究(退休金)。
(9)财产性收入研究。
(10)房地产需求问题。它与人口结构的关系。
(11)非正规金融问题(借款)。
(12)家庭消费的决定因素及模式变化。
2.CHIP (Chinese Household Income Project Survey)
链接:
http://www.icpsr.org/icpsrweb/ICPSR/studies/9836;jsessionid=5C778733263D9AE441544F58422017E2?classification=ICPSR.IV.B.http://www.icpsr.org/icpsrweb/ICPSR/studies/3012;jsessionid=5C778733263D9AE441544F58422017E2?classification=ICPSR.IV.B.http://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/21741简介:中国家庭收入项目调查。它是由国家统计局农调总队和中国社会科学院经济研究所共同开展此项专门调查。调查内容主要包括:收入、消费、就业、生产等有关方面的情况。现在做了三轮,分别是1988,1995,2002,可能2006的也正在进行中。这个数据是全部省份。这个数据的好处是,农村及城镇的数据都有。城镇每年家庭的数据大约有6800户,人数大约为20000人。农村每年家庭的数据大约有9200户,人数大约有38000人。
包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、受教育年限、行业、所有制、职业、就业状况、工资、总收入、工作小时数、参加工作年份、是否中共党员、是否当过兵、是否当过干部、吸烟花多少钱、喝酒花多少钱、是否残疾、医药支出额多少、生病的时间、从事家务劳动的时间、照顾家里其它病人的时间、工资收入总额、退休金、股票红利、工作天数、工作小时数、找工作的渠道、居住条件、开始非农就业的年份。(2)家庭层次上的变量。家庭总收入、家庭人口数、居住面积、房屋所有权、贷款的数量、借钱的途径、自己及配偶父母的家庭成分、家庭收入、老人补助金、现金支出、家庭消费、家庭财产。
可做的研究:
(1)教育回报率问题。
(2)收入不平等问题。
(3)劳动力供给问题。家庭财产、孩子(老人)、退休金、家务劳动时间。
(4)找工作的方式问题。
(5)行业的分布及变化。
(6)职业的分布及变化。人力资源管理。
(7)就业问题。失业率和劳动参与率。
(8)教育决定因素及教育不平等问题。
(9)社会保障方面的研究(退休金)。
(10)财产性收入研究(股票)。
(11)房地产需求问题。它与人口结构的关系。
(12)住房解决方式问题。
(13)农村非正规金融问题(借款)。
(14)家庭消费的决定因素及模式变化。
(15)党员、当兵、当干部、父母家庭成分对收入和就业的影响
(16)吸烟、喝酒等支出的决定因素及变化趋势
(17)农村老人补助金问题。
(18)老人养老安排问题。
(19)老年人劳动供给问题(退休年龄的提高)。
3. CHNS (China Health and Nutrition Survey)
链接:
http://www.cpc.unc.edu/china简介:中国健康与营养调查。由美国北卡罗莱纳大学教堂山校区的罗莱纳州人口中心和中国疾病控制和预防中心的国家营养和食品安全所合作建立的一个数据。这个数据最大的好处是,它是一个面板数据。而且,农村和城镇的数据都有。现有的数据有:1989, 1991, 1993, 1997, 2000, 2004,2006等年份。包括的省份:辽宁、黑龙江、江苏、山东、河南、湖北、湖北、湖南、广西、贵州。这些数据可以在网上下载。现在,国际一些好的刊物很多文章也是用这个数据做的。这个数据库涉及的变量较多,处理起来比较困难。以后年份的数据缺失可能比较严重。
包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、出生日期、民族、身高、体重、血压、病史、吸烟史、受教育年限(水平)、户口、是否干部、行业、职业、第二职业、工作单位的性质及人数、就业状况、工作时间(非常细致)工资、总收入、参加农业生产的情况。(2)家庭层次上的变量。农业生产、农作物价值、家庭总收入、家庭人口数、家庭支出(较详细)、家庭收入(较详细)、居住情况(详细)、交通工具、家庭消费、家庭财产、医疗费用(详细)、家庭成员生病(较详细)、食物消费(详细)。(3)社区层次变量。村人数、村户数、是否实行医疗保险、医院情况、消费结构、学校情况、计划生育情况、食品价格。
可做的研究:
(1)身高体重与食物结构的关系。
(2)劳动力市场上是否在身高等存在歧视。
(3)吸烟对健康的影响。
(4)健康对劳动力供给的影响。
(5)就业问题。
(6)劳动力供给时间问题。
(7)医疗保险对健康的影响。
(8)社区医疗结构(医院的多少)对健康的影响
(9)某些疾病的发病趋势。
(10)收入不平等问题。
(11)社会保障方面的研究。
(12)家庭消费的决定因素及模式变化。
4. CHARLS(China Health and Retirement Longitudinal Study)
(使用该数据要求填写保密协议,获得北京大学相关授权)
链接:
http://charls.ccer.edu.cn/charls/data.asp简介:中国健康退休跟踪调查。这个数据库是由北京大学中国经济研究中心赵耀辉教授负责的一个项目。这个项目实际是跟美国的HRS数据库并行的,主要是为了研究健康和退休行为。这个数据选取的样本是,年龄大于等于45岁。这个数据库的质量非常好,为了得到血样的数据,专门对相关的数据采集员做了培训。这个数据库最快明年春天就能用,并且它是对所有的研究者公开的。这个数据另外的一个好处是,它是一个面板数据。
包含的变量:包含的变量非常丰富。基本在劳动经济学研究中,能用到的变量都考虑到了。举几个例子。教育水平,细分到了硕士和博士;英语水平细分到了过了国家几级;大学是同等学历还是正规毕业;村干部细分到了村书记还是村会计
可做的研究:
(1)社会保障方面的研究;
(2)老龄化问题方面的研究;
(3)其它劳动经济学方面的研究;
(4)人口经济学方面的研究;
(5)卫生经济学方面的研究;