문제 정당화
기존 중고차 플랫폼의 한계
많은 중고차 서비스는 현재 매물가나 시세 범위를 보여주는 데 집중한다. 하지만 실제 사용자 의사결정은 그보다 더 복잡하다.
- 지금 가격이 적정한가
- 지금 팔면 손해가 큰가
- 몇 개월 뒤 감가가 더 커질 수 있는가
- 왜 이 차량은 동급 대비 비싸거나 싼가
기존 접근은 이 질문들에 충분히 답하지 못한다. 이유는 다음과 같다.
- 현재가 중심이라 시간축의 감가 리스크를 잘 설명하지 못한다.
- 동일 차량 식별이 불완전하면 단순 비교가 쉽게 흔들린다.
- 사고, 소유, 용도, 정비, 옵션 같은 설명 가능한 리스크 요인이 분리되지 않는다.
- 매물가와 실거래가 차이, 중복 등록, 급매, 시장 국면 변화가 모델에 그대로 섞이기 쉽다.
이 프로젝트의 문제 정의
이 프로젝트는 중고차 가치를 다음 네 층으로 본다.
- 코호트 기준선: 비슷한 차량군의 기본 가치
- 상태·이력 조정: 사고, 정비, 소유, 용도에 따른 프리미엄/패널티
- 시간·시장 정규화: 감가와 외부 노이즈 분리
- 설명 레이어: 사용자가 납득할 수 있는 이유 제공
핵심은 “현재 시세 조회”가 아니라 가격 + 감가 + 설명 가능성을 묶은 시스템이다.
왜 cohort-based 접근인가
현실 데이터에서는 VIN, 세대 구분, 중복 매물 정리가 완벽하지 않은 경우가 많다. 이런 상황에서 동일 차량 단위 패널만 기다리면 학습 가능한 데이터가 너무 줄어든다.
그래서 이 프로젝트는 다음 가정을 둔다.
- 먼저
make/model/trim/powertrain중심의 코호트를 정의한다. - 같은 코호트 안에서 주행, 사고, 소유, 정비, 옵션으로 편차를 설명한다.
- 필요할 때는
trim을 제거한 완화 코호트로 fallback 한다.
이 방식은 실무에서 더 견고하고, 설명 가능한 제품 UI와도 잘 맞는다.
사용자에게 중요한 것은 “왜”다
예측 정확도만 높아도 제품이 성공하는 것은 아니다. 중고차 사용자는 결과값만이 아니라 이유를 원한다.
- 왜 동급 대비 비싼가
- 왜 감가가 빨라질 수 있는가
- 어떤 이력이 가격 방어에 기여하는가
- 어떤 이력이 구조적 리스크를 의미하는가
그래서 이 프로젝트는 설명 레이어를 모델의 부가 기능이 아니라 핵심 산출물로 본다.