아파트 단지 조감도. 이미지는 본문 분석과 직접 관련은 없으며 이해를 돕기 위한 것입니다
APT margin 데이터 뉴스
집값이 오를지 내릴지는 늘 논쟁입니다. 누구는 금리를 보고 누구는 공급을 보며, 또 누구는 정책 한 줄에 시장의 운명을 겁니다. 그래서 이번에는 감으로 고르지 않기로 했습니다. 집값에 영향을 준다고 알려진 변수를 한꺼번에 데이터로 돌려, 무엇이 실제로 서울 아파트값을 움직였는지 숫자로 확인했습니다. 한국은행과 KB국민은행 등의 공개 통계 9년치를 썼습니다. 단순히 무엇이 상관있느냐에서 멈추지 않고, 모형이 학습에 쓰지 않은 구간을 실제로 맞히는지 백테스트로 검증했으며, 그 검증을 통과한 모형으로 6개월 뒤를 내다본 시나리오까지 정리했습니다. 이 글은 그 분석의 처음부터 끝까지를 그대로 풀어 놓은 기록입니다. 조금 길더라도 숫자가 어떤 길을 거쳐 결론에 이르렀는지 끝까지 따라오시기를 권합니다. 그 과정을 함께 밟고 나면, 다음에 집값 뉴스를 마주할 때 무엇을 먼저 봐야 할지가 한결 분명해질 것입니다.
집값을 둘러싼 가장 흔한 설명은 금리입니다. 금리가 내리면 오르고 오르면 내린다는 한 문장입니다. 틀린 말은 아닙니다. 그러나 이 설명은 절반만 맞습니다. 금리는 돈의 값일 뿐이고, 정작 시장을 움직이는 것은 그 값에 반응해 풀리거나 마르는 돈의 양이기 때문입니다. 같은 금리라도 시중에 돈이 넘칠 때와 마를 때 집값의 반응은 전혀 다릅니다.
그래서 이번 분석은 단순한 질문에서 출발했습니다. 금리, 통화량, 전세, 공급, 주가, 물가, 환율, 고용 가운데 서울 아파트값을 가장 잘 설명하는 것은 무엇인가입니다. 그리고 그 변수가 단지 과거를 설명하는 데 그치는지, 아니면 미래를 어느 정도 내다보게 해 주는지를 함께 물었습니다.
결론을 먼저 말씀드리면 이렇습니다. 집값은 하나의 변수로 설명되지 않았습니다. 여러 힘이 겹쳐 움직였고, 그중 가장 강한 손은 금리가 아니라 시중에 풀린 돈, 곧 통화량이었습니다. 그리고 놀랍게도, 그 힘들의 조합은 집값을 약 반년 앞서 가늠하게 해 주었습니다. 지금부터 그 과정을 하나씩 따라가겠습니다.
분석에 넣은 변수는 열 개입니다. 금리 쪽에서는 한국은행 기준금리와 시장 단기금리, 국고채 10년 금리를 넣었습니다. 유동성은 광의통화 M2를 썼고, 물가는 소비자물가지수를 넣었습니다. 주택 시장 안쪽 변수로는 KB국민은행 서울 아파트 전세가격지수와 전국 미분양주택 수를 넣었습니다. 그리고 거시 배경으로 코스피 주가지수, 원달러 환율, 실업률을 더했습니다. 설명하려는 대상인 집값은 KB국민은행 서울 아파트 매매가격지수입니다.
기간은 2017년부터 2026년까지, 모두 월 단위입니다. 한국은행 경제통계시스템과 공개 데이터에서 그대로 받은 원자료이고, 제가 손으로 만든 숫자는 하나도 없습니다. 분석에 쓴 데이터와 코드는 재현할 수 있도록 모두 보관했습니다. 누가 다시 돌려도 같은 결과가 나오도록 하는 것이 이런 분석의 기본이기 때문입니다.
비교를 위해 집값과 통화량, 전세, 미분양처럼 계속 쌓여 올라가는 지표는 전년 같은 달 대비 증가율로 바꿨습니다. 추세를 걷어내고 같은 출발선에서 견주기 위해서입니다. 금리와 실업률처럼 이미 비율인 지표는 그대로 썼습니다. 이렇게 단위를 맞춘 뒤에야 변수들을 공정하게 비교할 수 있습니다.
분석은 세 단계로 진행했습니다. 첫째, 각 변수가 집값과 얼마나 함께 움직였는지를 상관계수로 봤습니다. 둘째, 같은 달끼리만이 아니라 6개월 앞선 변수 값이 이후 집값을 예고하는지를 봤습니다. 예측에 쓸 수 있는 선행 신호를 찾기 위해서입니다. 셋째, 변수들을 한 모형에 함께 넣어 회귀분석을 하고, 마지막으로 그 모형을 학습에 쓰지 않은 구간으로 백테스트했습니다.
이 단계들은 일부러 보수적으로 짰습니다. 그럴듯한 결과 하나를 보여 주는 것은 쉽습니다. 어려운 것은 그 결과가 우연이 아님을 증명하는 일입니다. 그래서 상관에서 멈추지 않고 회귀로, 다시 백테스트로 단계마다 검증의 문턱을 높였습니다. 각 문턱을 통과한 것만 이 글의 결론에 담았습니다. 데이터 분석에서 가장 위험한 것은 보고 싶은 것만 보는 일이고, 그것을 막는 유일한 방법은 자기 결과를 스스로 의심하며 검증하는 일이기 때문입니다.

가장 먼저 확인한 것은 각 변수가 집값과 같은 방향으로 움직였는지입니다. 결과는 분명했습니다. 열 개 변수가 모두 집값 상승률과 통계적으로 유의한 관계를 보였습니다. 이 관계가 우연일 확률을 나타내는 p값이 모두 기준선 아래였습니다. 어느 하나도 무시할 수 없는 신호였다는 뜻입니다.
다만 신호의 강도는 변수마다 크게 달랐습니다. 같은 달 기준으로 가장 강한 변수는 통화량이었습니다. 통화량 증가율과 집값 상승률의 상관은 플러스 0.88였습니다. 전세가격이 플러스 0.85로 바짝 뒤를 이었고, 시장 단기금리가 마이너스 0.78, 기준금리가 마이너스 0.77로 반대 방향의 강한 신호였습니다.
중간 강도의 변수들도 있었습니다. 실업률은 플러스 0.52, 국고채 10년 금리는 마이너스 0.50, 주가는 플러스 0.41였습니다. 미분양은 같은 달 기준 상관이 마이너스 0.54로 중간 수준이었습니다. 물가와 환율은 같은 달 기준으로는 약한 편이었습니다.
여기까지만 보면 통화량과 전세, 금리가 집값을 끌고 다닌 핵심이라는 그림이 나옵니다. 그러나 같은 달 비교에는 한계가 있습니다. 원인과 결과가 섞여 있기 때문입니다. 집값이 올라서 전세가 따라 올랐을 수도 있고, 그 반대일 수도 있습니다. 그래서 한 걸음 더 들어가 시간의 순서를 봤습니다.
분석의 대상으로 서울 아파트 매매가격지수를 고른 데는 이유가 있습니다. 첫째, 서울 아파트는 한국 주택 시장에서 가장 거래가 활발하고 가격 정보가 촘촘한 자산입니다. 거래가 많을수록 가격은 시장의 진짜 수급을 반영하고, 분석의 신뢰도도 높아집니다. 거래가 드문 자산은 가격 한두 건이 전체 통계를 흔들지만, 서울 아파트는 그럴 위험이 적습니다.
둘째, 서울 아파트는 전국 시장의 방향타 역할을 합니다. 서울이 먼저 움직이면 수도권이 따라가고, 이어 지방으로 번지는 흐름이 지난 사이클마다 반복돼 왔습니다. 그래서 서울 아파트값의 동인을 이해하면 시장 전체의 큰 방향을 먼저 읽을 수 있습니다. 서울은 한국 부동산의 체온계인 셈입니다.
셋째, KB국민은행의 매매가격지수는 오랫동안 같은 방식으로 집계돼 시계열의 일관성이 높습니다. 중간에 기준이 자주 바뀌면 과거와 현재를 견주기 어려운데, 이 지수는 그 문제가 적어 9년이라는 긴 구간을 한 줄로 잇기에 적합했습니다. 분석의 토대가 흔들리지 않아야 그 위에 쌓은 결론도 단단합니다.
물론 서울 안에서도 강남과 강북, 재건축 단지와 외곽 신축의 움직임은 제각각입니다. 이번 분석은 그 평균을 본 것이지 개별 단지를 본 것이 아닙니다. 평균의 흐름을 읽은 뒤, 개별 단지는 안전마진으로 따로 따지는 두 단계가 필요한 이유가 여기에 있습니다. 큰 파도와 내 배의 위치는 다른 문제이기 때문입니다.
변수를 하나씩 뜯어보기 전에, 지난 9년의 큰 그림을 먼저 그려 두면 숫자가 한결 잘 읽힙니다. 서울 아파트 시장은 이 기간에 뚜렷한 네 번의 국면을 지났습니다. 각 국면에서 변수들이 어떻게 움직였는지를 머릿속에 그려 두면, 뒤에 나오는 상관계수가 단순한 숫자가 아니라 실제 시장의 기억으로 다가옵니다.
2017년부터 2019년까지는 완만한 상승기였습니다. 저금리가 이어지고 공급은 빠듯한 가운데 집값이 꾸준히 올랐습니다. 그러다 2020년과 2021년, 시장은 폭발했습니다. 감염병 대응으로 금리가 사상 최저로 내려가고 돈이 쏟아지면서 집값은 두 자릿수로 치솟았습니다. 이 시기가 통화량과 집값이 가장 강하게 동행한 구간입니다.
2022년부터 2023년 초까지는 급격한 하락기였습니다. 물가를 잡으려는 금리 인상이 빠르게 진행되면서 거래가 끊기고 집값 상승률이 마이너스로 돌아섰습니다. 팔리지 않은 집, 곧 미분양이 빠르게 쌓인 것도 이 시기입니다. 그리고 2024년 이후 시장은 다시 회복 국면에 들어섰습니다. 금리가 정점을 지나 인하 기조로 돌아서고 전세가 오르면서, 집값 상승률이 다시 플러스로 올라와 지금에 이르렀습니다.
이 네 번의 곡선은 우연이 아닙니다. 금리와 통화량, 전세와 미분양이 국면마다 같은 방향으로 함께 움직였습니다. 분석이라는 작업은 이 동행을 숫자로 확인하고, 그 안에서 반복되는 규칙을 찾아내는 일입니다. 지금부터 그 규칙을 변수 하나씩 꺼내 보겠습니다.
통화량부터 자세히 보겠습니다. 광의통화 M2는 현금과 예금, 곧 언제든 쓸 수 있는 돈의 총량입니다. 이 돈이 빠르게 늘면 자산을 사려는 힘이 강해지고, 그 힘은 결국 부동산으로 흘러갑니다.
데이터는 이 흐름을 또렷하게 보여줬습니다. 시중에 돈이 가장 빠르게 풀린 2020년과 2021년에 서울 아파트값도 가장 가파르게 올랐습니다. 당시 집값 상승률은 두 자릿수에 이르렀고, 통화량 증가율도 함께 정점을 찍었습니다. 두 선은 마치 한 몸처럼 같이 올라갔다가 같이 내려왔습니다.
반대로 2022년 들어 돈줄이 조이자 집값도 식었습니다. 통화량 증가세가 꺾이는 것과 거의 같은 시점에 집값 상승률도 무너졌습니다. 집값은 금리라는 가격표보다, 시중에 실제로 풀린 돈의 양을 훨씬 충실하게 따라갔습니다.
돈이 어떻게 집으로 흘러가는지는 어렵지 않습니다. 통화량이 늘면 예금 금리는 낮아지고, 갈 곳을 잃은 돈은 더 높은 수익을 좇아 자산 시장으로 움직입니다. 그 종착지가 한국에서는 늘 부동산이었습니다. 주식이 먼저 오르고, 이어 그 차익과 풍부해진 유동성이 아파트로 옮겨붙는 흐름이 사이클마다 반복됐습니다. 통화량은 그 모든 흐름의 가장 위쪽에 있는 수도꼭지인 셈입니다.
이 관계의 통계적 강도는 매우 높았습니다. 우연일 확률은 사실상 0에 가까웠습니다. 다만 한 가지 한계가 있습니다. 공개된 통화량 시계열이 2023년까지여서, 통화량은 과거를 설명하는 데는 가장 강력했지만 가장 최근의 예측에는 직접 쓰기 어려웠습니다. 이 점은 뒤에서 다시 다루겠습니다.

두 번째로 강한 변수는 전세였습니다. 전세가격 상승률과 집값 상승률의 상관은 플러스 0.85로, 통화량 다음으로 높았습니다. 전세는 집값의 바닥을 떠받치는 사다리 같은 역할을 합니다. 전세가가 오르면 매매가와의 차이가 좁아지고, 그 차이가 좁아질수록 차라리 사자는 수요가 늘어납니다.
전세가 매매를 끌어올리는 통로는 또 있습니다. 전세를 끼고 적은 돈으로 집을 사는 이른바 갭투자입니다. 전세가가 높을수록 필요한 자기 돈이 줄어, 매수 문턱이 낮아집니다. 그래서 전세 강세는 시차를 두고 매매 강세로 번지는 경우가 많았습니다.
실제로 전세는 6개월 앞선 값으로 봐도 집값과의 관계가 강하게 유지됐습니다. 전세가가 오르기 시작하면 반년쯤 뒤 매매가가 따라 오르는 패턴이 데이터에 남아 있었습니다. 전세는 그 자체로 집값의 선행 신호였습니다.
지금 시장에서 전세는 다시 오르고 있습니다. 입주 물량이 줄고 전세 수요가 늘면서 전세가가 단단해지는 국면입니다. 이 분석의 틀에서 보면 현재의 전세 강세는 앞으로의 매매가에 상승 쪽으로 작용하는 요인입니다.
다만 전세에는 양면이 있습니다. 전세가가 매매가에 너무 가까워지면, 이번에는 집값을 떠받치던 사다리가 부담으로 바뀝니다. 전세를 끼고 산 집의 값이 흔들리면 그 충격이 보증금으로 번지기 때문입니다. 그래서 전세 강세는 상승 신호이면서 동시에 시장의 취약점이기도 합니다. 지금처럼 전세가 빠르게 오르는 국면에서는 이 두 얼굴을 함께 봐야 합니다.
금리는 집값을 반대 방향으로 눌렀습니다. 기준금리와 집값 상승률의 상관은 마이너스 0.77, 시장 단기금리는 마이너스 0.78, 국고채 10년 금리는 마이너스 0.50였습니다. 세 금리 지표가 모두 일관되게 음의 관계를 보였습니다. 금리가 오르면 집값 상승률이 낮아진다는 뜻입니다.
2022년이 교과서 같은 사례입니다. 한국은행이 물가를 잡으려 기준금리를 빠르게 끌어올리자, 두 자릿수로 오르던 집값 상승률은 불과 1년여 만에 마이너스로 돌아섰습니다. 빌리는 값이 비싸지니 살 수 있는 사람이 줄고, 그만큼 수요가 식은 것입니다.
다만 금리와 통화량은 동전의 양면입니다. 금리를 내리면 돈이 풀리고, 올리면 돈이 마릅니다. 그래서 둘은 서로 강하게 얽혀 있습니다. 이 점은 뒤에서 여러 변수를 한 모형에 넣을 때 중요한 문제가 됩니다. 비슷한 정보를 담은 변수들이 서로의 효과를 가리기 때문입니다.
지금의 금리는 인하 기조입니다. 상관관계만 보면 집값에 상승 압력입니다. 그러나 금리가 내려도 그 돈이 시장으로 풀리지 않으면 효과는 반감됩니다. 오늘의 시장이 과거와 다른 지점이 바로 여기에 있는데, 마지막 부분에서 다시 짚겠습니다.

여기까지 읽으면 한 가지 의문이 듭니다. 그렇다면 정책은 어디에 있느냐는 것입니다. 대출 규제, 세금, 청약 제도 같은 정책은 분명 시장을 흔드는 큰 힘입니다. 그런데 이번 모형에는 정책이라는 변수가 직접 들어가 있지 않습니다. 일부러 뺀 것이 아니라, 정책은 하나의 연속된 숫자로 깔끔하게 측정되지 않기 때문입니다.
대출 한도를 6억원으로 묶었다는 사실은 매우 중요하지만, 그것을 매달의 숫자로 바꿔 회귀분석에 넣기는 어렵습니다. 대신 정책은 다른 변수를 통해 간접적으로 모형에 들어옵니다. 대출 규제가 강해지면 시중 통화량 증가가 둔해지고 미분양이 쌓이며, 금리 정책은 기준금리에 그대로 반영됩니다.
즉 정책은 통화량과 금리, 미분양이라는 통로를 거쳐 집값에 닿습니다. 이번 분석의 변수들은 바로 그 통로를 측정한 셈입니다. 그래서 정책을 따로 변수로 넣지 않아도, 정책의 효과는 이미 데이터 안에 녹아 있습니다. 변수들이 정책의 그림자를 담고 있는 것입니다.
지금 시장에서 정책의 무게는 어느 때보다 무겁습니다. 금리는 내려가는데 대출 규제와 스트레스 DSR이 그 돈이 시장으로 풀리는 길을 막고 있습니다. 금리 인하라는 상승 신호와 규제라는 억제 신호가 정면으로 부딪치는 국면입니다. 이 충돌이 앞으로의 집값을 가르는 핵심입니다. 금리만 보면 오를 장이지만, 그 금리가 유동성으로 번지지 못하면 과거 같은 급등은 나오기 어렵습니다.
이 점은 직전 호에서 다룬 금리 역설과 정확히 맞물립니다. 기준금리는 내려가는데 대출 한도와 스트레스 DSR이 차주가 실제로 빌릴 수 있는 돈을 줄이고 있습니다. 금리라는 신호와 한도라는 현실이 어긋나는 것입니다. 이번 분석이 통화량을 가장 강한 동인으로 지목한 만큼, 그 통화량이 규제에 묶여 있다는 사실은 앞으로의 상승 폭을 제한하는 가장 큰 변수입니다. 풀려야 할 돈이 묶이면, 상승의 엔진도 절반만 도는 셈입니다.
공급 쪽 지표인 미분양은 같은 달 기준으로는 상관이 마이너스 0.54로 중간 수준이었습니다. 그런데 6개월 앞선 값으로 보자 이야기가 달라졌습니다. 미분양의 6개월 선행 상관은 마이너스 0.84까지 강해졌습니다. 열 개 변수 가운데 가장 강한 선행 신호였습니다.
해석은 직관적입니다. 팔리지 않은 집이 쌓이기 시작하면, 그것은 수요가 식고 있다는 가장 빠른 증거입니다. 그리고 그 신호는 약 반년 뒤 매매가격에 그대로 나타났습니다. 미분양이 늘기 시작하면 반년 뒤 집값이 식는 패턴이 또렷했습니다.
미분양은 원인이자 결과라는 점도 함께 봐야 합니다. 집값이 식어서 미분양이 쌓이기도 하고, 미분양이 쌓여 집값을 누르기도 합니다. 그래도 방향은 한 번도 흐트러지지 않았습니다. 미분양이 빠르게 늘어나는 국면에서 집값이 강하게 오른 적은 지난 9년 동안 없었습니다.
이 선행성 때문에 미분양은 예측 모형의 핵심 재료가 됐습니다. 지금 미분양은 높은 수준이지만 증가세가 꺾이며 줄어드는 쪽으로 돌아섰습니다. 이 분석의 틀에서 보면 이는 앞으로의 집값에 상승 쪽으로 작용하는 신호입니다.
미분양이 강한 선행 신호인 데는 이유가 있습니다. 분양은 시장의 가장 앞단입니다. 새 아파트가 팔리는 속도는 수요의 온도를 가장 먼저 보여 줍니다. 그 온도가 식으면 기존 아파트 거래에도 곧 한기가 돌고, 가격은 그 뒤를 따릅니다. 그래서 미분양은 시장의 체온을 재는 가장 빠른 온도계 역할을 합니다. 통계청이나 부동산원의 거래량 통계보다도 미분양이 먼저 신호를 보내는 경우가 많았습니다.
나머지 변수들은 핵심은 아니었지만 무시할 수 없는 배경음이었습니다. 주가는 같은 달 상관이 플러스 0.41였고, 6개월 선행에서는 더 강해졌습니다. 주식으로 돈을 번 사람이 그 돈의 일부를 부동산으로 옮기는 이른바 자산효과로 설명됩니다. 다만 최근 주가가 이례적으로 급등해, 이 변수는 예측에 쓰기 까다로운 상태가 됐습니다.
물가와 환율은 같은 달 기준으로는 약했지만 6개월 선행에서는 신호가 또렷해졌습니다. 물가가 오르면 실물 자산인 부동산으로 돈이 몰리는 인플레이션 헤지 수요가 작동하고, 환율이 흔들리면 위험 회피 심리가 자산 시장 전반에 영향을 줍니다. 다만 이들은 집값을 직접 끌기보다 분위기를 만드는 쪽이었습니다.
실업률은 다소 의외의 결과였습니다. 집값 상승률과 플러스 0.52의 상관을 보였습니다. 보통 고용이 나빠지면 집값이 약할 것이라 생각하기 쉽지만, 데이터에서는 경기와 금리, 정책이 복잡하게 얽히면서 단순한 직관과는 다른 패턴이 나타났습니다. 이는 상관이 인과가 아니라는 점을 보여 주는 좋은 사례이기도 합니다.
정리하면 거시 변수들은 집값의 큰 흐름을 좌우하는 주연은 아니었습니다. 그러나 시장의 방향이 바뀌는 길목에서 먼저 움직이며 신호를 보탰습니다. 주연은 통화량과 전세, 금리, 미분양이었고, 이들이 무대를 끌고 갔습니다.
그렇다고 이 배경 변수들을 넣은 것이 헛수고는 아니었습니다. 시장의 큰 전환점에서는 이들이 먼저 흔들리며 경고음을 냈기 때문입니다. 주가가 꺾이고 환율이 출렁이며 물가가 방향을 틀 때, 그것은 곧 부동산에도 변화가 온다는 예고인 경우가 많았습니다. 주연을 보되 배경음을 무시하지 말아야 하는 이유입니다. 시장의 전환은 늘 가장자리에서 먼저 시작됩니다.
이제 변수들을 한꺼번에 넣어 회귀분석을 했습니다. 전 기간에 걸쳐 안정적으로 구할 수 있는 여덟 개 변수를 한 모형에 넣자, 설명력은 약 86퍼센트에 이르렀습니다. 집값 상승률의 변동 가운데 86퍼센트가량을 이 변수들로 설명할 수 있었다는 뜻입니다. 경제 데이터에서 이 정도 설명력은 상당히 높은 편입니다.
이 모형에서 끝까지 통계적으로 또렷하게 살아남은 변수는 금리, 전세, 주가, 실업률이었습니다. 흥미롭게도 미분양과 국고채, 물가는 단독으로는 유의했지만 다른 변수와 함께 넣자 신호가 약해졌습니다. 비슷한 정보를 담은 변수들이 서로의 설명력을 나눠 가졌기 때문입니다.
특히 금리와 국고채, 단기금리는 서로 너무 닮아 한 모형에 다 넣으면 효과가 흩어졌습니다. 통계에서는 이를 다중공선성이라 부릅니다. 이 문제 때문에 예측 모형에서는 변수를 욕심껏 다 넣지 않고, 서로 겹치지 않으면서 신호가 강한 변수만 골라 쓰는 것이 오히려 낫습니다.
그래서 다음 단계인 예측에서는 변수를 셋으로 줄였습니다. 서로 다른 정보를 담고 있으면서 각자 강한 신호를 가진 미분양, 전세, 금리입니다. 수요의 선행 신호인 미분양, 매매의 사다리인 전세, 자금의 가격인 금리. 이 세 가지면 집값의 큰 흐름을 담기에 충분하다고 봤습니다.
변수를 줄이는 것이 손해처럼 보일 수 있지만 예측에서는 반대입니다. 변수가 많을수록 모형은 과거 데이터의 우연한 잡음까지 외워 버립니다. 이를 과적합이라 부르는데, 과적합된 모형은 과거는 완벽하게 설명하지만 미래에서는 무너집니다. 시험 범위를 통째로 외운 학생이 새 문제 앞에서 막히는 것과 같습니다. 꼭 필요한 변수만 남기는 절제가 오히려 미래를 더 잘 맞히게 합니다. 단순함이 곧 강건함입니다.
상관과 회귀는 이미 일어난 일을 설명할 뿐입니다. 진짜 질문은 예측입니다. 그래서 백테스트를 했습니다. 방법은 이렇습니다. 2022년까지의 데이터만으로 모형을 만들고, 2023년부터 2026년까지는 모형이 한 번도 보지 못한 구간으로 남겼습니다. 그런 다음 미분양과 전세, 금리만으로 6개월 뒤 집값을 예측하게 하고, 시간이 흐를 때마다 새 데이터를 더해 다시 학습시키는 방식으로 실제와 맞춰봤습니다.
이 방식이 중요한 이유가 있습니다. 모형이 답을 미리 본 채로 과거를 맞히는 것은 의미가 없습니다. 시험 문제를 미리 보고 푼 셈이기 때문입니다. 그래서 모형이 절대 보지 못한 미래 구간으로만 채점했습니다. 이것이 진짜 실력을 재는 방법입니다.
이렇게 한 달씩 앞으로 걸어 나가며 검증하는 방식을 워크포워드라고 부릅니다. 매달 그 시점까지의 데이터로만 모형을 다시 만들어 바로 다음을 예측하고, 한 칸 앞으로 가서 이를 반복합니다. 실제 투자자가 매달 새 정보를 받아 판단을 갱신하는 상황과 가장 비슷한 검증입니다. 과거 전체를 한꺼번에 보고 맞춘 것이 아니라, 그때그때 알 수 있었던 정보만으로 그다음을 맞힌 것입니다.
결과는 기대 이상이었습니다. 학습에 쓰지 않은 구간에서 모형의 설명력은 0.73였습니다. 예측값과 실제값의 상관은 0.95로 거의 겹쳤습니다. 그냥 반년 전 값을 답으로 내는 단순 예측과 비교하면 오차가 30퍼센트 작았고, 집값이 오를지 내릴지 방향도 약 78퍼센트 맞혔습니다.
이 검증을 통과했다는 점이 이 분석에서 가장 중요합니다. 과거를 그럴듯하게 설명하는 모형은 흔하지만, 보지 못한 미래를 실제로 맞히는 모형은 드뭅니다. 미분양과 전세, 금리라는 단순한 세 변수만으로도 집값의 큰 흐름은 반년 앞서 가늠할 수 있었습니다. 복잡한 예언이 아니라 단순한 규칙이 더 잘 통했습니다.
한 가지 더 짚을 점이 있습니다. 모형이 가장 크게 빗나간 때는 시장이 방향을 트는 전환점 부근이었습니다. 추세가 이어지는 구간은 잘 맞혔지만, 오르던 시장이 꺾이거나 식던 시장이 돌아서는 순간은 한 박자 늦게 따라갔습니다. 이는 추세를 학습하는 모든 모형의 숙명이기도 합니다. 그래서 예측값이 전환점을 가리킬 때는 숫자 하나만 믿지 말고 다른 신호와 함께 더 신중하게 봐야 합니다.

검증을 통과한 모형에 지금의 조건을 넣어 6개월 뒤를 내다봤습니다. 현재 서울 아파트값은 전년 대비 약 15퍼센트 오른 상태입니다. 미분양은 줄고 있고, 전세는 오르며, 금리는 인하 기조입니다. 세 신호가 모두 상승 쪽을 가리킵니다. 다만 관건은 방향이 아니라 속도입니다.
세 가지 가정을 넣어봤습니다. 금리가 더 내리고 전세가 강해지며 미분양이 빠르게 소진되는 낙관 시나리오에서는 6개월 뒤 상승률이 약 10퍼센트로 나왔습니다. 규제가 유지되고 금리가 동결되는 기준 시나리오에서는 약 7퍼센트, 공급 부담이 커지고 전세가 둔화되는 비관 시나리오에서는 약 6퍼센트였습니다.
방향은 셋 다 같았습니다. 상승세는 이어지되 상승률은 지금보다 낮아진다는 것입니다. 현재의 두 자릿수 상승이 6개월 뒤에는 한 자릿수로 둔화되는 그림입니다. 급락도 급등도 아닌, 오름폭이 좁혀지는 국면을 데이터가 가리킵니다.
각 시나리오의 가정을 조금 더 풀어 보면 이렇습니다. 낙관은 금리가 추가로 내리고 전세가 더 오르며 쌓인 미분양이 빠르게 팔려 나가는 그림입니다. 비관은 반대로 공급 부담이 다시 커지고 전세 상승이 멈추는 경우이며, 기준은 지금의 조건이 큰 변화 없이 이어지는 경우입니다. 세 결과의 차이가 4퍼센트포인트 안쪽이라는 점도 눈여겨볼 만합니다. 어떤 가정을 넣어도 방향이 뒤집히지 않는다는 것은, 그만큼 지금 신호가 한쪽으로 일관되게 쏠려 있다는 뜻입니다.
이 전망이 의미하는 바는 분명합니다. 지금 사면 무조건 오른다는 식의 낙관도, 곧 폭락한다는 식의 공포도 데이터의 그림과는 거리가 있습니다. 상승의 관성은 남아 있지만 그 힘은 약해지고 있습니다. 이런 국면일수록 어디를 사느냐가 수익을 가릅니다.

이 분석에는 분명한 한계가 있습니다. 정직하게 밝히는 것이 데이터를 다루는 사람의 의무라고 생각합니다. 첫째, 상관과 예측력이 인과를 증명하지는 않습니다. 변수들은 서로 얽혀 있고, 모형은 그 동행을 학습한 것이지 원인을 밝힌 것이 아닙니다.
둘째, 공개된 통화량 시계열이 2023년까지여서 통화량은 과거 분석에만 썼고 예측 모형에서는 뺐습니다. 가장 강한 변수를 예측에 직접 쓰지 못한 것은 아쉬운 대목입니다.
셋째, 최근 주가가 이례적으로 급등해 과거 학습 범위를 크게 벗어났습니다. 그래서 예측 모형에서는 주가를 일부러 제외하고, 값의 범위가 안정적인 미분양과 전세, 금리만으로 시나리오를 만들었습니다. 학습한 적 없는 극단값을 모형에 무리하게 넣으면 엉뚱한 숫자가 나오기 때문입니다.
그럼에도 백테스트가 보여준 일관성은 신뢰할 만합니다. 완벽한 예언이 아니라, 큰 방향과 속도를 가늠하는 나침반으로 보시면 됩니다. 나침반은 정확한 목적지를 알려 주지는 않지만, 엉뚱한 방향으로 가지 않게 막아 줍니다. 이 분석의 쓸모도 거기에 있습니다.
여기까지의 결과를 손에 쥐었을 때, 실수요자가 빠지기 쉬운 두 가지 함정이 있습니다. 첫째는 숫자를 맹신하는 것이고, 둘째는 숫자를 무시하는 것입니다. 둘 다 위험합니다. 모형이 6개월 뒤 한 자릿수 상승을 가리킨다고 해서, 그것이 모든 단지에 똑같이 적용되는 보증서는 아닙니다.
이 분석이 말하는 것은 시장 전체의 평균적인 방향과 속도입니다. 평균이 한 자릿수로 둔화된다는 것은, 어떤 단지는 여전히 강하게 오르고 어떤 단지는 오히려 빠진다는 뜻을 품고 있습니다. 평균이 둔화되는 국면일수록 단지 사이의 편차는 오히려 커집니다. 돈이 한정되면 좋은 입지로만 몰리기 때문입니다.
그래서 이 결과는 거시 배경으로 깔고, 그 위에서 개별 판단을 더해야 합니다. 시장이 둔화 국면이라면, 비싸게 산 분양가를 시세 상승이 메워 줄 여력이 줄어듭니다. 바꿔 말해 안전마진의 중요성이 더 커지는 국면입니다. 시장이 식을수록 싸게 사는 것이 유일한 안전벨트가 됩니다.
반대로 이 분석을 무시하고 분위기에만 휩쓸리는 것도 위험합니다. 금리 인하 뉴스 하나에 들떠 무리하게 비싼 단지를 잡거나, 미분양 통계 하나에 겁먹고 좋은 기회를 놓치는 일이 흔합니다. 데이터는 그런 감정적 결정의 닻이 되어 줍니다. 오를지 내릴지가 아니라, 얼마나 빠른 속도로 어느 방향인지를 숫자로 잡아 주기 때문입니다.
정리하면 이렇습니다. 큰 방향은 이 분석으로 읽고, 자금 계획은 직전 호의 금리와 대출 규제 분석으로 짜며, 마지막으로 개별 단지는 분양가와 실거래의 차이로 따진다. 이 세 겹을 포개야 비로소 청약이라는 큰 결정을 숫자 위에 올려놓을 수 있습니다.
많은 사람이 집을 살 때 가장 큰 실수는 한 가지 정보에만 매달리는 것입니다. 누구는 금리만 보고, 누구는 호재만 보고, 누구는 남들이 산다는 이유로 삽니다. 이 분석이 보여 주듯 집값은 여러 힘이 겹쳐 만든 결과이고, 그 힘들은 서로를 밀고 당깁니다. 하나만 보면 반드시 다른 하나에 발목을 잡힙니다. 여러 신호를 함께 포개어 보는 습관, 그것이 데이터가 가르쳐 주는 가장 실용적인 교훈입니다. 집은 평생 가장 큰 거래이고, 그만큼 가장 많은 신호를 살펴야 할 대상입니다.
9년 데이터와 백테스트가 가리키는 결론은 단순합니다. 집값은 금리 하나로 설명되지 않습니다. 통화량과 전세, 공급이 함께 움직이고, 그중 시중에 풀린 돈의 양이 가장 큰 힘이었습니다. 그리고 그 흐름은 미분양과 전세, 금리를 통해 반년 앞서 어느 정도 읽힙니다. 지금 신호는 상승 지속이되 둔화입니다.
실수요자에게 이 그림은 실용적인 기준이 됩니다. 상승률이 둔화되는 국면일수록 비싸게 산 분양가는 회복에 시간이 더 걸립니다. 시장이 두 자릿수로 오를 때는 다소 비싸게 사도 시세가 따라와 주지만, 한 자릿수로 둔화되는 국면에서는 분양가와 시세의 차이가 그대로 손익이 됩니다.
그래서 더더욱, 청약할 단지의 분양가가 인근 실거래보다 싼지를 먼저 따져야 합니다. 시장 전망은 배경이고, 단지별 안전마진은 그 위에 겹쳐야 할 실선입니다. APT margin이 분양가와 실거래의 차이로 안전마진을 계산하는 이유가 여기에 있습니다.
데이터는 거짓말을 하지 않습니다. 다만 데이터는 평균과 흐름을 말할 뿐, 내가 청약할 그 단지의 운명을 콕 집어 주지는 않습니다. 큰 흐름은 이 분석으로 읽고, 그 위에서 단지별 안전마진을 따지는 것. 그것이 숫자로 집을 보는 가장 단단한 방법입니다.
마지막으로 한 가지를 덧붙입니다. 이런 분석은 한 번 하고 끝나는 것이 아닙니다. 매달 새 데이터가 쌓이면 모형도 다시 학습하고 시나리오도 갱신해야 합니다. 시장은 살아 움직이고, 어제의 규칙이 내일도 똑같이 통하리라는 보장은 없습니다. 그래서 이 분석은 정기적으로 다시 돌려 결과를 갱신해 나가겠습니다. 숫자로 집을 보는 일은 한 장의 사진이 아니라 계속 이어지는 영상이기 때문입니다. 오늘의 결론도 그 긴 영상의 한 장면일 뿐입니다. 그 장면들이 차곡차곡 쌓여, 시장을 보는 흔들리지 않는 눈이 됩니다.
오늘도 APT margin이었습니다.