Commentary
戸籍や政治的身分も調べる「中国総合社会調査」
中国学へのミクロデータ活用法:社会調査データ編①
ミクロデータを使って社会経済問題を研究するのは修士論文を書いたとき(1987年)からです。それ以来、約30年にわたって、国内外の研究仲間と一緒に中国各地の農家、企業、市民、農民工などを対象にアンケート調査を行い、膨大なミクロデータを集め、学術研究に使いました。
併行して、中国の研究機関などが開発したミクロデータを収集し、それを用いた研究成果を積極的に発表しました。中国総合社会調査(Chinese General Social Survey:CGSS)を使うようになったのはその延長線上にあります。
研究者に公開されている日・中・韓・台湾の総合的社会調査
CGSSは、2000年に初めて実施された日本版総合的社会調査(Japanese General Social Surveys:JGSS)から3年遅れて開始されたものです。CGSSもJGSSも1972に始まったアメリカのGeneral Social Surveys(GSS)に起源を持ちます。今、韓国総合社会調査(KGSS)、台湾社会変遷調査(TSCS)のほか、日本・中国・韓国・台湾による東アジア社会調査プロジェクト(East Asian Social Survey:EASS)も2006年より実施されています。各国・地域のGSSの持つ特徴として、全国をカバーし、調査を継続的に実施し、調査から得られたミクロデータを国内外の研究者に公開するといった点が挙げられます。
CGSSはこの間、2つのラウンド(2003-08年、2010-22年)、計15回実施されましたが、新型コロナなどの影響で2004年、2020年と2022年の調査データが公開されていません。第1ラウンドは中国人民大学と香港科技大学の共同実施でしたが、第2ラウンドは中国人民大学が単独で組織、実施しています。CGSSの発端や全体的状況に関しては、中国人民大学中国調査与数据中心『中国総合社会調査報告(2003-2008)』(中国社会出版社、2009年)が詳しく、同プロジェクトの進展状況、データ利用、研究成果などについては、中国人民大学のウェブサイト(http://cgss.ruc.edu.cn/)から確認できます。
前述のとおり、GSSのミクロデータは1-2年後に国内外の研究者に公開されなければなりません。CGSSの場合、ウェブサイトで利用申請すれば、簡単にデータセット(spss、stata)をダウンロードすることができます。もちろん、日本の研究者、大学院生、学部生なども同じです。実際、私のゼミ生がCGSSを利用して修士論文を書いたことがあります。
CGSSの個票は各調査で1万程度にすぎませんが、調査対象は、社会調査の標準的な手続きに基づいて全国各地の都市と農村から抽出されています。そのため、データセットを解析して得られた事実発見をもって全国の状況を推測することは統計的に有意だけでなく、複数回の調査結果を比べて諸事象の経時的変化を観測することも可能です。これは特定の地域を対象とする一過性の調査にはないメリットであり、大きな魅力が感じられるところです。
CGSSは専門的訓練を受けた調査員が質問紙に基づいて対面方式で実施し、回答者は対象世帯の18歳以上構成員からランダムに抽出された1人となっています。調査票は世帯員の基本属性から始まり、回答者の性別、生年、宗教、教育、政治的身分、戸籍、健康、就業、収入、職業、社会階層、社会保障、政治参加など社会、経済、政治、文化などの学術研究に資する豊富な項目に及んでいます。700以上にも上る調査項目の中に、客観的な状況を表す収入や職業のようなものもあれば、幸福感、階層帰属といった主観的な意識を表すものもあります。所得分配に重点を置くCHIP(China Household Income Project)、家計金融資産を主に調査するCHFS(China Household Finance Survey)に比べて、CGSSは社会各方面の総合的な情報収集に強みを有するといえます。
たとえば、中国社会の特質を理解するのに、共産党員という政治的身分や、都市と農村を分断する戸籍制度に関する詳細な情報が欠かせないといわれますが、CGSSではそうした調査項目が最初から一貫して取り入れられています。実際、それらを用いた研究成果が蓄積されつつあります。アイディア次第ではCGSSの持つ可能性は非常に大きいのです。
データを用いて「中国における幸福感や公平感」を分析
最新の統計によれば、CGSSを用いた学術論文は、中国語が4033本、英語が954本、博士・修士論文もそれぞれ1341本、123本に上ります。(2022年12月末)。中でも、幸福感、社会資本、人的資本、社会的信用、不平等、教育、生育意識といったキーワードに高い関心が集まっています(大学サロン第185期:中国大型学術調査二十年= https://m.youtube.com/channel/UChnTf6-SqrxZWafWNuIiNjA)。
Wang et al.(2021)は、 CGSS2005-2015の計7回の調査データを用いて、中国における相対的福利貧困を測定し、幸福感に及ぼすその影響を計量的に分析しています(Measurement of relative welfare poverty and its impact on happiness in China: Evidence from CGSS, China Economic Review, 69)。また、朱赫・李昇(2023)は、CGSS2017を用いて情報技術の都市・農村間の所得格差や公平感に与える影響を明らかにしています(信息技術、城郷収入与公平感——基于CGSS数拠的実証研究、『社会学評論』第3期)。
筆者もCGSSなどを解析し、中国社会の特質の解明に取り組んできました。具体的には、共産党員という政治的身分、戸籍の相違や農業戸籍から非農業戸籍への転換(農転非)、最終学歴およびその取得方法(正規か成人教育か)が、人々の就業選択、給与、昇進、階層移動にどのような役割を果たしたか、そのような役割が時間の経過とともにどのように変化したかについて、さまざまな角度から実証分析しています。それをとおして多くの興味深い事実が発見できました。
たとえば、ほかの条件が同じ場合、一般人に比べて、共産党員という身分を持つ者は比較的高い給与を得ていますが、市場経済化が進むにつれ、そのような、いわば党員プレミアムが減少していきます。対照的に、人的資本を表す教育の収益率(受けた教育が1年増えたことによる給与の増加率)は市場経済化の深化に伴い、上がってきたことが明らかとなりました。こうした分析の背後には、市場化、国際化をモットーとする改革開放が進むにつれ、「党員身分のような政治的資本に代わり、生産性の向上に必要な人的資本の重要性が増すであろう」という仮説があります。
一方で、CGSSのデータの限界や利用上の注意点もあります。CGSSでは、全国各地から抽出された1万の居民・村民委員会(都市部・農村部の末端自治組織)は固定されるものの、それぞれの中から調査対象とされる10世帯はその都度ランダムに抽出されます。つまり、CGSSは、中国健康与養老追跡調査(China Health and Retirement Longitudinal Study:CHARLS)や中国家庭追跡調査(China Family Panel Studies:CFPS)のようなパネルデータではなく、クロスセッションデータとなっています。データ利用の際、この点に留意する必要があります。
CGSSは全体として厳格な手続きを踏んで実施され、公開データは入力ミスの訂正などデータ・クリーニングが済まされたものですが、それを利用する場合、データセットに対するさらなる調整が必要不可欠です。年齢、性別、婚姻、就業など論理的に関連し合う調査項目の間に整合性が取れない、あるはずの値が欠損したりする、ケタ違いの外れ値が出ている、異なる時点の調査では設問や答えるための選択肢の表現が微妙に違ったりする、といった問題が散見されるためです。データ解析に先立ち、データの調整に多くの時間が費やされなければなりませんが、有意な分析結果を得るのに、それはやむをえないプロセスです。ミクロデータにムラがあることは当たり前であり、それを恐れてデータ利用を敬遠する必要はありません。
データの適切な解析のために「中国を見る目」を養う
それよりも、蓄積・公開されたデータの中から、いかに新しいテーマを見つけ出すか、ということが重要です。それは自らの問題意識や既存研究に対する理解と深く関係します。研鑽していくしか方法がありません。
近年、数多くのミクロデータが開発され、その一般公開も進んでいます。経済学、社会学などの社会科学分野では、そうした2次データを駆使した理論的実証的研究が世界的に進められています。特定の村や企業を対象とする事例研究は伝統的な研究手法として確立し、日本の中国研究は比較的それに長けており、これまで膨大な成果を蓄積しています。ところが、従来の中国調査が難しくなっている今、2次データの活用も中国理解のうえで大きな可能性を秘めるでしょう。
むろん、面白い研究テーマを見つけ、データ解析の結果を適切に解釈するには、中国を見る目、あるいはさまざまな事象を理解する現地感覚が必要です。そうした能力を身につけるために、中国に出向いて現地の人々の暮らしを観察したり、彼らと交流したりすることも欠かせません。