01. 분석 배경
특수학교는 ‘신체나 지능에 장애가 있는 아동 및 청소년에게 특별한 교육을 하는 학교’를 의미합니다. 서울의 경우, 특수 학교를 필요로 하는 대상이 2021년을 기준으로 10만 명에 달하며, 이는 서울 인구의 1%에 달하는 수치입니다.
본 아티클에서는 머신러닝을 활용해 특수 학교의 최적 입지를 분석하고, 이를 활용해 앞으로 특수 학교 건립에 있어 나아갈 방향을 제시해보려고 합니다.
1) 특수학교 현황 파악
특수학교가 설립될 입지를 본격적으로 분석하기 전에, 우선 서울시내 특수학교 현황을 알아보도록 하겠습니다.
2019년부터 2021년까지 3개년동안 서울시 특수학교 현황을 파악한 결과, 25개 자치구 중 17개의 자치구에만 특수학교가 존재했습니다. 특히, 한강 근처 자치구에는 3개년동안 특수학교가 지어지지 않았음을 알 수 있습니다.
2) 특수학교 설립 필요성
다음으로는 특수학교가 추가적으로 설립되어야 할 필요성을 수용률 측면, 장애 학생 및 학부모 수요 측면에서 살펴보도록 하겠습니다.
① 수용률 측면
조사 결과, 연도별 특수교육 대상자 수와 연도별 특수학교 개수 모두 증가했음을 알 수 있습니다. 그렇다면 이렇게 증가한 특수학교는 특수교육 대상자를 어느 정도로 수용하고 있을까요?
연도별 특수학교 개수만을 시각화했을 때 그 수가 점차 증가했던 것과 달리, 특수학교 수용률은 오히려 감소했습니다. 특수학교 증가율이 특수 교육 대상자 수 증가율을 따라잡지 못한다는 의미입니다.
히스토그램을 자세히 살펴보면, 전국적으로 전체 특수교육 대상자 중 30프로 미만의 장애 학생들만 특수학교에서 교육을 받고 있다는 사실을 알 수 있습니다. 이는 특수학교 부족으로 인해 장애 학생들이 비장애 학생들에 비해 교육권을 보장받고 있지 못하고 있음을 나타냅니다.
② 장애 학생 및 학부모 수요 측면
아래는 2020년 교육부 특수교육 현황 조사에서 장애학생 전학 경로와 특수 학교로 전학한 이유를 유형별로 나누어 히스토그램으로 시각화한 결과입니다.
먼저 장애학생 전학 경로를 학교 과정별로 분류한 결과, 유치원을 제외한 모든 시기에 특수학교로 전학한 비율이 높았음을 알 수 있습니다. 초등학교 때 특수학교로 전학하는 학생이 가장 많았는데, 이는 의무교육 시작 시기인 초등학교 때 자녀의 장애에 따라 특수 교육의 필요성을 느끼고 전학을 결정하는 것으로 생각됩니다.
다음으로는 장애 유형별로 특수 학교로 전학한 이유를 분석했습니다. ‘특수학교(유치원) 교육 과정이 자녀에게 더 적절할 것 같아서’, ‘비장애아동들과 함께 공부하거나 생활하는 일이 어려워서’가 주된 이유로 선택되어 장애 학생 및 학부모 입장에서 특수 교육의 필요성을 알 수 있었습니다. 또한 ‘이사 등 거주지를 이동해서’가 대부분의 장애 유형에서 세 번째로 많이 선택되어 거리 요인 역시 학교 선택에 있어 중요함을 알 수 있었습니다.
3) 특수학교에 대한 인식
이번에는 특수학교 설립에 대한 대중들의 인식을 알아보기 위해, ‘특수학교’를 키워드로 한 기사 및 댓글 크롤링을 진행해보도록 하겠습니다.
① 네이버 뉴스 기사 크롤링
총 82개의 뉴스 기사로 크롤링을 진행한 결과, 위와 같은 워드 클라우드를 얻을 수 있었습니다. 대부분의 기사들이 특수학교 설립, 관련 정책에 대한 내용을 다루고 있었으며, 정부 역시 특수 학교 설립에 관심을 가지고 꾸준히 정책을 추진하고 있었음을 알 수 있었습니다.
네이버 뉴스 기사 크롤링 상세 내용
② 유튜브 댓글 데이터 수집
부족한 기사 댓글 수를 보완하기 위해, 유튜브 뉴스와 다큐멘터리 영상 댓글을 이용해 추가 크롤링을 진행했습니다. 20개의 영상에서 956개의 댓글을 수집해 감정을 4가지로 분류했습니다. 특수 학교 설립의 어려움에 대해 ‘분노’ 혹은 ‘안타까움’‘분노’ 혹은 ‘아쉬움’을 표현하는 댓글이 대부분이었고, 특수학교 설립에 반대하는 댓글은 단 하나도 존재하지 않았습니다.
유튜브 영상 크롤링 상세 내용
이와 같은 댓글 분석을 통해, 특수학교 설립과 관련된 여론이 상당히 긍정적임을 확인했습니다.
02. 최적 입지 분석
1) 분석방향 및 데이터 전처리
최적 입지 분석 과정에서 군집화를 이용해 최적 자치구를 선정하고, 이후 GIS를 통해 최적 자치구 내의 동까지 선정해보도록 하겠습니다.
① 구 선정
데이터 분석에 필요한 칼럼을 추출해 데이터를 생성하고, 생성한 데이터에 대해 MinMaxScaler를 적용합니다. 이후 각 칼럼 별로 중요도에 따라 설정한 가중치를 곱한 뒤 합해 지수를 구했습니다. 이때 수치가 클수록 특수학교 설립 입지에 적합하도록 설정했기 때문에, 유해성과 공시지가는 역순으로 처리하도록 합니다.
칼럼 별 가중치
② 동 선정
동 별 지형과 장애인 수를 고려해 GIS로 데이터를 합쳐 최종적인 최적 입지를 선정합니다.
2) 군집화를 이용한 모델링 (K-means)
① 군집화 (K-means)
주어진 데이터 집합을 유사한 데이터들의 그룹으로 나누는 것을 군집화(clustering)라 하고 이렇게 나누어진 유사한 데이터의 그룹을 군집(cluster)이라 합니다. 군집화는 예측 문제와 달리 특정한 독립변수와 종속변수의 구분도 없고 학습을 위한 목푯값도 필요로 하지 않는 비지도학습의 일종입니다.
군집화는 비계층적 군집화(Partitioning Clustering), 계층적 군집화(Hierarchical Clustering)로 분류되고, 여기서 비계층적 군집화는 중심 기반 군집화와 밀도 기반 군집화로 나뉩니다. K-means 알고리즘이 바로 중심 기반 군집화의 대표적인 알고리즘이라고 할 수 있습니다.
K-means 알고리즘은 샘플 데이터를 K개의 cluster로 묶는 알고리즘입니다. 각 cluster 내의 유사도는 높이고, cluster 간의 유사도는 낮추는 것을 통해 cluster 거리 차이의 분산을 최대화하는 것이 목적입니다.
K-means 알고리즘 작동 과정
임의의 k를 정합니다.
k개의 cluster centroid(cluster의 중심이 되는 특정 포인트)를 임의로 선택합니다.
각 샘플의 레이블을 가장 가까운 centroid에 해당하는 클러스터 레이블로 할당합니다. 각 cluster에 속한 샘플들의 평균을 계산하여 모든 centroid를 업데이트합니다.
centroid의 값의 변화가 없을 때까지 3번과 4번 과정을 반복합니다.
군집화, K-means 알고리즘과 관련된 더 자세한 설명은 아래의 링크를 참고해주세요!
② 군집화 과정
# 최적의 군집 개수 구하기
inertia = []
for k in range(2, 10):
km = KMeans(n_clusters=k, random_state=42)
km.fit(feature)
inertia.append(km.inertia_)
plt.plot(range(2, 10), inertia)
plt.xlabel('k')
plt.ylabel('inertia')
plt.show()
Python
복사
자치구를 군집화하는 과정에서는 경사가 완만해지는 k=4를 최적의 개수로 선정했습니다. 데이터 개수가 적기 때문에 최소한의 군집 개수로 군집화를 진행했습니다.
km = KMeans(n_clusters=4, init='k-means++', max_iter=300, random_state=0)
km.fit(feature)
Python
복사
③ 군집화 결과 분석
군집 별 특징을 파악하기 위해 각 지수를 통계 낸 결과 위와 같은 결과를 도출할 수 있었습니다. 최종 점수는 군집 0번에서 가장 높게 나왔음을 확인할 수 있었습니다.
이어서, 군집 별로 세부 특성을 확인해보도록 하겠습니다.
•
군집 0
군집 0
현재 특수학교 설립 현황 (이름이 나와있는 자치구는 설립 완료)
군집 0 세부 점수
→ 총 9개의 자치구가 있으며, 동대문구를 제외한 나머지 자치구에는 이미 특수학교가 존재했습니다.
→ 세부 점수의 거의 모든 부분에서 1등을 차지했고, 공시지가와 유해성 부분에서만 3등이라는 순위를 보여주었습니다.
•
군집 1
군집 1
군집 1 세부 점수
→ 총 9개의 자치구가 있으며, 그 중 3개의 구에는 특수학교가 존재하지 않았습니다.
•
군집 2
군집 2
군집 2 세부 점수
→ 총 4개의 자치구가 있으며, 그 중 3개의 구에는 특수학교가 존재하지 않았습니다.
→ 세부 점수의 거의 모든 부분에서 최하위를 차지했습니다.
•
군집 3
군집 3
군집 3 세부 점수
→ 총 3개의 자치구가 있으며, 그 중 영등포구에만 특수학교가 존재하지 않았습니다.
3) GIS
① GIS를 통한 분석 방법
GIS(공간 정보 시스템)란, 모든 유형의 데이터를 생성, 관리, 분석, 매핑하는 시스템입니다. GIS는 데이터를 맵에 연결하고 위치 데이터를 모든 유형의 데이터와 통합합니다. 과학을 포함한 산업 분야에서 사용되는 매핑 및 분석의 기초를 제공합니다. GIS를 통한 최적 동 선정 방법은 아래와 같습니다.
GIS를 통한 최적 동 선정
위성 영상을 이용해 경사, 등고선 데이터를 추출합니다. 이때 각 구 별로 경사도가 1/12 이하인 지역만을 추출하도록 합니다. 이는 장애인등편의법 시행 규칙에 따른 경사도입니다.
동별 장애인 수를 지도 시각화합니다.
위의 두 데이터를 합쳐 최적 입지를 선정합니다.
② 동대문구
동대문구는 군집화 결과 군집 0에 속해 최종 점수가 가장 높으며, 특수학교가 아직 설립되지 않은 자치구입니다. 동대문구의 GIS 분석 결과는 다음과 같습니다.
•
경사도
•
동 별 장애인 수
이러한 분석을 통해 선정한 동대문구 내의 최적 입지는 ‘장안동’입니다.
③ 영등포구
영등포구는 정부의 특수학교 설립 정책 대상 중 가장 높은 최종 점수를 보여주었습니다. 영등포구의 GIS 분석 결과는 다음과 같습니다.
•
경사도
•
동 별 장애인 수
이러한 분석을 통해 선정한 영등포구 내의 최적 입지는 ‘대림동’입니다.
03. 결론
1) 분석 결과
① 동대문구
최적 구 선정 후 관련 자료 조사 결과, 동대문구는 서울시 교육청의 특수학교 설립 계획 2단계에 선정되어 특수학교 설립 최적 입지로 적절함을 알 수 있습니다. 또한 동대문구에서는 다양한 장애인 복지 사업을 진행하고 있습니다. 입지 선정 과정에서 장애인 복지 프로그램 등은 고려하지 않았으므로, 관련 데이터를 고려한 실제 최종 점수는 분석 결과보다 더 높을 것으로 예상됩니다.
② 영등포구
영등포구 역시 동대문구와 함께 서울시 교육청의 특수학교 설립 계획 2단계에 선정되었습니다.
다만 아쉬웠던 점은, 입지 면에서는 좋은 조건을 보여주었지만 대외적으로 알려진 장애인 복지 프로그램이 동대문구에 비해서는 부족한 편이었습니다. 또한 유해성 지수가 높아 이에 대한 해결 방안이 필요할 것이라 생각됩니다.
2) 개선 방안
최근 장애인 인권 이슈가 대두되며, 특수 학교 설립 역시 하나의 화두로 떠오르고 있습니다. 정부 역시 특수학교 설립 정책에 관심이 많지만, 다음과 같은 한계점이 존재합니다.
① 특수학교 설립 기준의 모호성
특수학교 설립 기준이 일반 학교 설립 기준이 크게 다르지 않다는 문제점이 존재합니다. 장애 학생의 특성을 충분히 고려한 입지 선정 기준이 필요합니다.
② 부지 선정의 어려움
지역 주민이 반대하면 부지 선정이 매우 어려워지고, 학교가 교외에 설립될 가능성이 높아집니다. 이는 장애 학생이 겪는 이동의 어려움과 맞물려 교육권 보장을 더욱 어렵게 합니다.
이와 같은 한계점을 고려해 지역 주민 및 장애 학생, 학부모가 모두 만족할 수 있는 보다 명확한 설립 기준이 필요합니다.
3) 프로젝트 평가
마지막으로, 프로젝트를 진행하며 느꼈던 아쉬움과 발전 방향을 함께 정리해보도록 하겠습니다.
1.
데이터의 한계
•
특수교육 대상자가 될 ‘구별 저연령층 장애인 수 데이터’가 아닌 전체 연령층의 장애인 수 데이터를 사용했습니다. 공공 데이터 신청 등의 방법을 통해, 추가적인 데이터를 수집할 수 있을 것으로 생각됩니다.
2.
특수학교 설립 기준의 모호성
•
아티클의 최적 입지 선정에서는 기존 학교 설립 기준을 사용했지만, 선행 연구와 분석 결과를 기반으로 하는 설립 기준을 자체적으로 수립할 수 있을 것입니다.
3.
세부 부지 선정 미흡
•
동 선정 이후, 실제로 학교가 설립될 부지에 대한 선정은 아직 마치지 못했습니다. GIS를 활용한 3D 분석을 통해 보다 자세한 위치를 선정할 수 있을 것으로 예상됩니다.
아티클에서 제시한 최적 입지 설립 방안이 모든 학생이 평등한 교육권을 누리는 데에 아주 조금이라도 도움이 되기를 바라며 글을 마칩니다. 감사합니다!