인터뷰 전문보기 (2019년3월28일~ 2023년7월10일)
10월27일 (수) <오늘의 시선> ‘통계로 들여다보는 제주’ (미디어제주 김은애 기자)
◇ 인터뷰 전문보기 자료에 대한 저작권은 제주MBC에 있습니다. 전문 게재나 인터뷰 내용을 인용할 경우, 채널명과 정확한 프로그램명을 밝혀주시기 바랍니다. 이 프리뷰는 실제 방송 원고가 아닌 사전 원고로 작성된 것으로 실제 방송과는 차이가 있을 수 있음을 양해 바랍니다.
윤 : 수요일, 우리 사회의 다양한 눈으로 제주의 가치를 더하는 <오늘의 시선>,
미디어제주 김은애 기자와 함께 합니다. 안녕하세요?
오늘은 어떤 이야기를 나눠볼까요?
김 : 오늘은 ‘통계로 들여다보는 제주’를 주제로 이야기를 나눠보려고 합니다.
선거철이면 다양한 여론조사가 실시되고, 각 후보 지지율에 대한 결과도 공개되곤 하는데요, 이를 대비해 보자는 측면에서 관련된 이야기도 더해 볼까 합니다.
윤 : 통계로 들여다보는 제주라.. 그런데 들어가기에 앞서 여론조사를 대비하자는 말을 해주셨는데, 무슨 의미죠?
김 : 조사 방식이나 결과를 해석하는 과정에서 발생할 수 있는 통계의 오류를 생각해 보자는 건데요, 통계 결과로 드러나는 수치의 결과, 즉 팩트 그 자체가 때론 정답이 아닐 수 있다는 것, 이미 많은 분들도 알고 계실 거예요. 소위 말해 ‘통계의 오류’라고 하죠.
실례로 일부 언론에서 통계값을 토대로 현안을 해석하면서, 눈속임으로 그래프를 그리는 사례가 종종 발견되잖아요? 이는 특정 의도를 갖고 비논리적인 주장을 변호할 때 사용되는 수법이라 볼 수 있겠는데요. 아무리 전문가라도 때론 통계를 과대해석하거나 잘못 해석하는 경우가 생길 수 있다는 점. 사람이기 때문에 그럴 수 있겠지만,
이런 점을 유의하시면서 오늘의 이야기도 비판적으로 들어주셨으면 합니다.
어쩌다보니 제가 오늘의 시선 자리에서 늘 하는 이야기인 것 같기도 한데요. 비판적 사고방식은 아무리 강조해도 지나치지 않은 것 같습니다.
윤 : 통계를 분석할 때 중요한 변수가 무시되거나, 표본 크기나 비율에 대한 각자의 가중치를 염두하지 않을 경우 오류가 생길 수 있다는 사실, 우선 지적해주셨는데요.
그래도 오늘 다룰 사항은 신뢰할만한 기관에서 시행한 통계값 내용이겠죠?
김 : 네, 물론입니다. 저는 오늘 제주도나 제주연구원, 정부 등 신뢰할만한 기관에서 발표한 통계 결과만을 가지고 내용을 다룰 건데요, 그럼에도 불구하고 통계의 오류는 늘 존재할 수 있기 때문에 해석하는 이는 물론, 받아들이는 분들 스스로도 주의가 필요합니다.
예를 들어서 A라는 백신의 바이러스 예방율이 60%고, B라는 백신의 예방율이 80%라고 가정해 볼게요. 단순히 이 통계만 보아선 당연히 B 백신이 바이러스 예방 측면에서 높은 효과를 자랑하고 있다고 해석할 수 있겠죠.
하지만 A백신과 B백신을 실험한 표본 대상이 각각 차이가 있다면.. 가령 A 백신은 바이러스 고위험군인 50~60대를 대상으로 투여해 실험을 했고, B 백신은 비교적 건강한 20~30대를 대상으로 실험을 했다면?.. 아마 각각의 예방율에 대한 통계는 신뢰하기 어려워집니다.
따라서 통계를 보실 땐 표본대상이 제대로 설정되어 있는지, 너무 적은 표본만을 대상으로 조사한 것은 아닌지, 질문 문항이 편향되어 있지는 않은지, 혹은 끼워 맞추기 위한 데이터 정리가 된 것은 아닌지, 이렇게 다양한 부분들을 고려해야겠고요.
현실적으로 비전문가인 우리가 이런 부분을 다 고려하면서 통계값을 해석하기란 거의 불가능에 가깝긴 합니다만. 그래도 꼭 해야 할 이야기인 것 같아서 서론을 길게 잡아봤습니다.
윤 : 지금까지가 서론이었군요. 그럼 본격적으로 오늘의 주제로 들어가서, 통계로 보는 제주 이야기 나눠볼까요?
우선 어떤 통계부터 살펴볼까요?
김 : 우선 고령인구비율부터 보죠. 전 세계적으로 인구의 고령화 문제가 사회문제로 대두되고 있는데요. 혹시 제주의 고령화 문제. 국내 타 시도와 비교했을 때 어떤 수준일 거라고 예상이 되시나요?
윤 : 글쎄요, 최근 10년 이내 젊은 층이 많이 유입되긴 했지만, 그럼에도 고령층 비율은 점차 늘어나는 추세라서. 쉽게 답을 내리기 어렵네요. 실제로 어떻죠?
김 : 통계청 정보에 따르면, 2020년 전국의 고령인구비율은 16.4%에 달하는데요.
여기서 고령인구비율이란, 국내 전체 인구에서 65세 인구가 차지하는 비율을 뜻합니다. 고령인구비율이 높을수록 노령화가 심화되고 있다는 뜻이죠.
그리고 제주의 경우 전국 평균보다 0.7%p 낮은 15.7%의 고령인구비율을 보이고 있는데요. 국내 17개 시도 중에선 11번째로 높은 고령인구비율을 보이고 있습니다.
참고로 가장 높은 고령인구비율을 보인 곳은 23.5%로 전라남도 지역이고요. 가장 낮은 고령인구비율을 보인 곳은 9.8%로 세종특별자치시입니다.
윤 : 고령화 사회 문제에서 전국 평균보단 제주가 그나마 나은 상황인 듯 합니다만. 보다 명확한 진단을 위해선 고령화인구비율의 증가세도 함께 살펴야 할 것 같은데요? 앞서 지적해주신 통계의 오류를 범하지 않기 위해서요.
김 : 맞습니다. 2011년부터 2020년까지 최근 10년 동안의 고령인구비율 증가세를 보면요. 이점이 또 주목할 만한 것 같아요. 2011년부터 2016년까지는 전국 평균 고령인구비율보다 제주의 고령인구비율이 더 높았습니다. 즉, 고령화 사회가 전국에 비해 제주도가 더 심화되어 있었다는 의미죠.
그런데 이는 2017년을 기점으로 역전되는데요. 2017년 전국과 제주의 고령인구비율이 14.2%로 동일한 수치를 기록했고. 그 이후부터는 2018년 제주가 14.4%, 전국이 14.8%. 2020년엔 전국이 16.4% 제주가 15.7%를 기록하게 됩니다. 제주가 전국 평균 보다 낮은 고령인구비율을 가지게 된 거죠.
다만 또 한가지 통계의 오류에 빠지기 않기 위해 주목해야 할 점은요. 어디까지나 전국 평균보다 상황이 낫다는 거지, 10년 동안 고령인구비율은 전국과 제주 모두 꾸준히 상승 중이라 긍정적으로 보기만은 힘들다는 겁니다.
제주의 고령인구비율은 2011년 12.6%에서 2020년 15.7%로 10년 새 3.1%p나 증가한 고령인구비율을 기록하고 있고요. 게다가 제주의 인구증가율은 2011년부터 꾸준히 전국 평균보다 월등히 높은 수치를 기록하고 있기 때문에. 이점을 보면 제주의 고령화 문제는 가속화되고 있는, 우리 사회가 함께 고민해야 할 문제라는 결론을 도출할 수 있겠습니다.
윤 : 고령화 사회, 하면 늘 함께 따라오는 문제가 낮은 출산율에 대한 내용인데요.
출산율은 전국과 제주를 비교했을 때. 어떤 수준이죠?
김 : 전국 평균보다는 제주 상황이 나은 편이지만, 낙관하긴 어려운 것이 2014년부터 계속해서 출산율이 낮아지고 있기 때문인데요.
2014년 전국 평균 출산율은 1.205명이었고, 제주는 1.481명이었어요. 그런데 2020년 기준 전국의 평균 출산율은 0.847, 제주는 1을 간신히 넘겨 1.021의 출산율을 기록하고 있습니다.
일반적인 상식에선 출산율이 2를 넘겨야 기존 인구 수가 유지된다 보고 있으니까. 제주를 포함해 대한민국의 인구 수는 계속 감소세에 있다 볼 수 있죠.
좀 더 와 닿는 통계 한 가지를 더 부연하자면요. 노령화지수라는 통계치가 있어요. 유소년 인구인 0세부터 14세까지 인구를 100명이라고 가정했을 때. 고령 인구는 몇 명일까 환산을 해서 미래 고령인구를 예측해보는 통계 내용인데요.
제주의 경우 2038년 유소년인구가 100명 있다면, 65세 이상 고령인구가 264명가량 있을 거라는 예측이 나오고요. 더 멀리 가서 2047년엔 고령인구가 351명까지. 고령인구가 유소년 인구보다 세 배 이상 많은, 고령화사회가 예상되고 있습니다.
윤 : 지금 소개해주신 내용도 통계청 자료에 의한 내용이죠?
고령화사회 문제가 명확하게 통계로 드러나는 만큼, 사회적 고민이 필요해 보이네요.
이어 다음 주제로 넘어가서, 환경 주제로 이야기 해 보죠. 관련해서 다룰 만한 이야기, 무엇이 있나요?
김 : 여기서도 통계의 오류 이야기를 하고 싶은데요.
쓰레기 문제. 주민 1인당 배출하는 생활폐기물 배출량에 대한 통계 내용입니다..
2019년 기준으로 전국의 주민 1인당 하루에 배출하는 생활폐기물량은 1.1kg으로 조사되고 있고요. 제주는 1.8kg으로 전국에서 가장 많은 배출량을 기록하고 있는데요.
단순히 이 통계값만 보면 어떤 생각이 드시나요?
윤 : 전국 평균보다 제주도의 배출 폐기물량이 많으니, 제주의 쓰레기 문제가 역시 심각하구나. 하는 생각을 일반적으로 하지 않을까요?
김 : 그렇죠. 좀 더 확대 해석해보면 제주의 주민들이 가장 쓰레기를 많이 버리는구나, 이런 생각도 들고요.
물론 제주의 쓰레기 문제가 심각한 건 맞습니다만... 이 통계값을 산출하는 과정에는 치명적인 오류가 하나 있습니다. 바로 관광객에 의한 쓰레기와 같은 외부 요인을 전혀 고려하지 않고 세워진 산식으로 통계값을 매기고 있다는 건데요.
통계청이 밝힌 산식을 보면, 전체 폐기물 발생량을 주민등록인구로 나눈 값이 바로 주민 1인당 생활폐기물 배출량이거든요. 그런데 제주는 관광지다보니 관광객에 의해 버려지는 쓰레기량이 어마어마합니다. 따라서 이 통계는 적어도 제주에 한해선 해석을 달리 해야 하는 통계라고 볼 수 있습니다. 관광객에 의해 버려지는 쓰레기량을 함께 고려해야만 주민이 버리는 쓰레기량이 산출될 수 있기 때문이죠.
윤 : 관광객이 배출하는 쓰레기량을 고려하지 않고 조사가 이뤄졌기 때문에 통계 결과를 해석한 결과에서 오류가 발생할 수 있다는 건데요. 앞서 말씀하신 통계의 오류가 이 같은 잘못된 산식에서 비롯되는 경우가 왕왕 있죠. 유의해야겠습니다.
다음으로 어떤 통계치를 다뤄볼까요?
김 : 끝으로 최근 버스공영제 확대에 대한 목소리가 나오고 있는데, 관련된 문제인 제주의 자동차 문제를 통계로 살펴보겠습니다.
제주에 등록된 자동차 수는 2011년 기준 25만여 대였고, 2020년 기준 61만5000여 대까지 두 배 이상 증가하게 되는데요.
주민등록인구가 2010년 57만7000여 명에서 2020년 69만7500여 명인 점을 감안하면. 인구 증가율에 비해 자동차 증가율이 월등히 높다는 사실을 알 수가 있죠.
특히 인구 증가율은 계속 2010년과 2020년을 비교했을 때 20% 이상 증가했는데요. 반면, 자동차 등록대수 증가율은 2010년에 비해 2020년 145% 이상 증가한 수치를 보이고 있습니다.
윤 : 인구 증가율에 비해 자동차 증가율이 월등히 높다는 사실은 대중교통 이용률과 관련한 문제와도 연결지어 생각해볼 여지가 있다는 거군요.
그렇다면 인구에 비해 자동차 수만 확연히 늘어난 현상을 어떻게 해석할 수 있을까요?
김 : 여러 가설을 세워볼 수 있을 것 같아요. 첫 번째, 제주의 1인가구 수 통계를 보면 2015년 58446명에서 2020년 81855명으로 상당히 증가세를 보이고 있거든요. 늘어난 1인 가구 수나 제주로 이주한 사람들 수 만큼 자동차 수 또한 증가했을 가능성이 있고요.
다음으로는 렌터카 업체가 2010년 이후 늘면서, 이에 따른 차량 증가 문제도 있을 거로 보입니다. 그런데 여기에서도 숨은 통계의 오류가 하나 있습니다. 바로 실제 도내에서 운행되는 차량의 수는 위 통계와 차이가 있다는 사실입니다.
윤 : 제주에 등록만 해놓고 도외에서 운행하는 차량들이 있죠? 이 차량은 앞서 설명하신 도내 등록 차량대수에서 제외시켜야 정확한 제주도내 운행차량에 대한 통계가 나오겠군요.
김 : 맞아요. 제주도가 밝히기로는 지난 9월말 기준 제주지역에 등록만 해놓고 타 지역에서 운행하는 차량이 약 24만8400여 대라고 하는데요.
이에 따라 실제 도내에서 운행하는 차량은 40만대를 조금 넘어설 것으로 예상됩니다.
다만 그럼에도 불구하고 제주의 인구 당 차량보유대수는 1명당 0.592대로 전남에 이어 전국 2위를 차지하고 있고요. 세대 당 보유대수는 1세대 당 1.308대라 전국 1위를 차지하고 있기에. 도심의 주차난이나 미비한 대중교통 이용률과 같은 문제는 여전히 산재한 상황이라고 해석할 수 있겠습니다.
윤 : 오늘 여러 통계 내용과 함께 통계의 오류에 대한 문제도 지적해주셨는데요.
끝으로 통계의 오류에 빠지지 않기 위해, 우리가 주의해야 할 점이 있다면 무엇인지 설명해주시죠.
김 : 통계학자들이 공통적으로 주장하는 이야기 중 하나가 바로 평균값의 함정에 빠지지 말라는 건데요. 어떤 통계에서 평균값이 100이라고 했을 때, 값에 대한 전체적인 분포가 어떻게 이뤄졌는지를 함께 살펴야 합니다. 그래프가 최고나 최하위 값에 치우쳐 있고, 평균값인 중앙값은 아주 적은 부분만 차지하고 있다면. 오히려 평균값은 진정한 의미의 평균이 아닐 수 있다는 거죠.
또 앞서 언급한 내용인데 표본이 어떻게 수집되었고, 수식을 어떻게 세우고 있는지 확인해야 하겠고요. 일부 전문가들은 너무 한쪽에 치우쳐 극단적으로 보이는 수치는 왜곡된 통계일 가능성이 있다고 말하기도 하는데. 예를 들어 여론조사의 경우 질문지에 있는 선택지의 차이에 따라 확연히 다른 결과가 나오기도 합니다.
특정 정치인에 대한 조사에서 정책 수행을 매우 잘했다, 대체로 잘했다, 대체로 못했다, 매우 못했다. 이렇게 네 가지 선택지를 준 것과, 잘했다, 못했다, 잘 모르겠다..
세 가지 선택지만 준 것에는 큰 차이가 있어요.
만약 응답자가 “정책 수행을 대체로 잘했다고 생각하지만, 못한 부분도 일정 부분 있어 문제가 있긴 해~” 이렇게 생각할 경우 어떨까요. 네 가지 선택지에서는 ‘대체로 잘했다’라고 응답할 가능성이 클 테고, 세 가지 선택지라면 ‘잘 모르겠다’라고 선택할 가능성이 큽니다.
그리고 이런 응답이 누적된다면 똑같은 사람에게 똑같은 질문을 하더라도, 선택지 내용에 따라 결과가 엄청나게 달라질 수 있겠죠.
이러한 통계의 함정, 설문조사의 함정이 존재한다는 사실을 기억하시고. 통계 자료를 접하신다면 본질에 접근하는 것이 좀 더 수월하지 않을까 생각해봅니다.
윤 : 그렇군요. 오늘 이야기는 여기서 마무리하겠습니다.
지금까지 미디어제주 김은애 기자와 함께 했습니다. 감사합니다.
김 : 감사합니다.