[CRUX]수치 데이터를 이용한 표본분석 : 이론
게시글 주소: https://ys.orbi.kr/00065547224
크럭스(CRUX) 컨설팅
크럭스 컨설팅 12월 11일(월) 올해 마지막 정시예약 : 여기 클릭하시면 됩니다.
<수치 데이터를 이용한 표본분석 이론>
안녕하세요. CRUX 김희범입니다.
(글 읽으시기 전에 ‘좋아요’와 ‘팔로우’ 부탁드립니다)
표본분석이란 무엇일까요? 표본분석은 왜 하는 것일까요?
이 질문에 대한 답변은 표본분석을 시도하는 이유와 이용하는 방법에 따라 크게 달라질 수 있습니다.
전통적인 표본분석은 내 위에 있는 모든 사람들을 조사하고 기록하고 관찰하는 것입니다. 지원권이 한정된 폐쇄된 구간에서 흔히 ‘카운팅’이라고 불리는 방법으로 허수, 추합 등 빠져나갈 인원을 한 명씩 걸러냅니다. 경쟁자들의 점수, 타 지원 학과를 하나씩 찾고 별명을 붙이거나 특이사항을 메모할 수도 있습니다. 이러한 추적은 잘못하면 끝이 없는데, 경쟁자들이 지원한 학과의 표본을 열어보지 않으면, 결국 의미가 없기 때문입니다. 따라서 매우 제한적으로만 사용할 수도 있고, 개인이 사용할 수 있는 대상 범위는 넓게 잡아도 이과는 인설의, 문과는 과거 서울대 지원권 정도입니다. 이러한 방법의 목적은 닫힌 구간 내 미시적인 한두 자리 싸움에서 승리하는 것입니다.
그보다 넓은 구간에서도 내 위 경쟁자들의 점수를 하나씩 기록할 수는 있습니다. 하지만 추합을 따지거나 경쟁자의 이동을 찾자니 끝이 없습니다. 요즘 계열제 모집단위나 대형과는 모집인원만도 100명이 넘어가는데, 이들을 모두 기록하고 있을 수는 없는 노릇입니다. 오히려 간소하게 각 ‘표본’이 아니라 ‘수치’를 다루기도 합니다. 나의 등수가 몇 등인지, 예상 컷부터 나까지 몇 명이나 있는지 등입니다. 그런데 이런 데이터는 모아 놓아도 제대로 읽기가 어렵습니다. 각 수치들이 어떤 의미를 내포하고 어떻게 연결되는지 잘 모르기 때문입니다. 그리고 분석서비스들이 제공하는 수치 지표들은 결국 분석서비스가 제공하는 결론으로 귀결됩니다. 그렇다 보면 숫자들에서 유의미한 정보를 뽑아내지 못하고 ‘칸수’에 매몰됩니다.
수치를 다루는 표본분석의 목적은 무엇일까요? 수치를 이용한 표본분석의 목적은 거시적인 측면에서 ‘흐름’을 읽는 것입니다. 한두자리 싸움에 집중하는 것이 아니라, 내가 속한 게임판의 상황을 읽는 용도입니다.
입시에 임하는 개인이 ‘흐름’을 읽는 것은 매우 어렵고 한정적입니다. 아래는 ‘개인’이 조금이나마 흐름을 느낄 수 있도록 하는 의도에서, 최대로 간략화한 데이터 정리 시트 양식입니다. (저희 '컨설턴트'들은 훨씬 더 종합적인 다른 방식을 사용합니다. 기본적으로 제 노하우를 바탕으로 하되, '개인'도 시도해볼 수 있도록 계량했습니다.)
오늘은 바로 이 수치 데이터를 이용한 표본분석에 대해서 소개해 보려 합니다.
엄밀히 말하면 표본분석이라기보다는 나만의 입시 리포트, 혹은 입시 포트폴리오라고 생각할 수 있을 것 같습니다. 필요한 만큼, 가능한 만큼, 할 수 있는 만큼, 하고 싶은 만큼 수치를 모으고 계산하면 됩니다. 오늘은 양식에 대한 설명이고, 다음 글이 보다 실전적일 예정입니다.
먼저 상단은 과거 데이터와 올해 나의 정보를 기입하는 부분입니다.
왼쪽 위에는 관찰하고자 하는 학과 정보(학교, 군, 학과)를 적습니다.
상단 중앙 부분에는 과거 데이터를 입력합니다. 당시의 모집정원과 추가합격인원, 지원자수를 기입하면, 엑셀을 이용하여 자동으로 합격총원, 추합율, 최종경쟁률을 구할 수 있습니다.
이렇게 정보를 기입해 놓으면, 어느 정도 규모의 과인지, 어느 정도 추합이 도는지, 경쟁률은 어느 정도 되는지를 확인할 수 있습니다. 다만 주의할 점은 학과 신설, 통폐합, 군 변동, 입시 정책 변화(교차지원 도입) 등에 따라 데이터가 크게 바뀔 수 있습니다. 올해가 바로 그 변화의 해일 수도 있고요. 이러한 히스토리와 특이사항을 가장 오른쪽 메모란에 기록해 놓으면 됩니다.
과거 누백도 기록합니다. 컨설턴트들은 조금 더 체계적인 방법을 사용하지만, 개인이시라면 많이들 이용하는 누백 데이터를 쓰셔도 무방합니다. 70% 누백은 공시되는 정보를 바탕으로 하는데, 과거 합격인원의 허리하단부 누백을 확인할 수 있게 해주어 안정 지원 범위를 확인시켜줍니다. 100% 누백은 점공 등을 통해 확인하거나 자체적으로 예측한 추정치에 바탕으로 둡니다. 인터넷에 돌아다니는 누백은 틀린 정보가 많지만, 일반적으로 폭빵을 확인할 수는 있습니다. 3~4개년치 데이터에서 툭 튀는 누백값이 보이면 폭이나 빵으로 보시면 됩니다. 이러한 내용도 해석해서 오른쪽 메모란에 적어놓으면 좋습니다.
그리고 과거 누백들 바로 밑에 올해 나의 누백을 기록하시면 됩니다. 과거의 70%컷, 100%컷과 비교해서 매우 대략적으로 자신의 위치를 가늠할 수 있습니다. 사실 각 해의 누백은 서로 독립적인 것이어서 이렇게 묶어보는 것이 엄밀한 방법은 아닙니다. 주의하여 사용하시기 바랍니다. 분석기도 입시철에 계속 최신판이 나오는데, 최신 누백을 기록하고 싶으시다면, 그냥 기존 나의 누백을 지우고 새로운 나의 누백을 기록하면 됩니다. 이전 누백도 남기고 싶으시면, 메모란에 히스토리를 남겨놓으면 됩니다. (사실 누백은 라인 잡는 시기 이후로는 무용한 편이어서 굳이 세세하게 최신화하지 않아도 됩니다. 다만, 분석기를 철썩 같이 믿는 지원자들도 있어서, 하나의 변인으로 인정하고자 기록할 수 있는 공간을 마련한 것입니다.)
왼쪽 아래에는 나의 산출점수를 기록합니다. 변환표준점수 공개 이후 점수가 달라질 수 있는데, 이 경우는 위 누백과 달리, 반드시 새롭게 바뀐 자기 점수를 업데이트하시길 바랍니다.
내 점수 오른쪽에는 올해 모집인원을 기록합니다. 이 부분도 데이터가 최신화될 수 있습니다. 수시 이월 전에는 최초 모집인원이나 예측 모집인원을 사용하다가, 최종모집인원이 공개되면 수치를 바꿔주면 됩니다. 이러한 변동도 메모란에 변동일과 함께 기록해주시면 좋습니다.
모집인원을 기록하면, 과거데이터를 바탕으로 기대 추합인원, 기대 합격인원, 평균추합율, 기대지원자수, 평균경쟁률을 확인할 수 있습니다.
이 수치들을 설명하자면,
평균추합율은 그 위에 기입했던 ‘과거 추합율의 평균치’입니다.
‘기대 추합인원 = 최종모집인원 x 평균추합율’로 과거 정보를 바탕으로 올해 기대되는 추합인원을 구할 수 있습니다.
‘기대 합격총원 = 최종모집인원 + 기대 추합인원‘ 입니다.
평균경쟁률은 그 위에 기입했던 ‘과거 경쟁률의 평균치’입니다.
‘기대 지원자수 = 최종모집인원 x 평균경쟁률’이며, 과거 경쟁률을 바탕으로 올해 기대되는 지원자수를 구할 수 있습니다.
주의할 점은, 튀는 값이나 더 이상 유의미하지 않은 값이 존재할 수 있다는 점입니다. 모집 인원 변화, 군 이동, 학과 통폐합, 입시 제도 및 방식 변화, 폭빵, 마감 직전 절대적으로 낮았던 경쟁률 등등이 원인입니다. 이러한 히스토리를 알고 있느냐, 아웃라이어 등을 어떻게 처리할 것이냐가 ‘개인’의 실력이라고 할 수 있습니다.
다음은 본격적으로 수치들을 기록하는 부분입니다.
왼쪽에는 날짜를 기록합니다. 저는 12/30~1/5으로 7일간 한 번씩으로 예시 시트를 만들어드렸지만, 개인의 상황에 따라 날짜나 시간대를 더하거나 빼거나 하시면 됩니다. 그래도 마지막 3일간은 하루에 한 번씩은 기록하기를 권합니다.
입력해야 하는 정보는 예측 지표, 예측컷, 최초합격 가능 인원, 추가합격 가능 인원, 실제지원한 분석대상자수와 나의 등수, 나보다 하나 높은 칸까지의 인원수 내 칸의 꼴지의 순위, 나의 실제지원 등수 변화, 전체 모의지원자수와 그중 나의 전체 등수, 예측 지원자수, 적정 누백(점수)과 예상 누백(점수)입니다.
하나씩 설명드리면,
예측지표는 각자 자신이 보고 있는 지표를 입력하면 됩니다. 색깔일 수도 있고, 확률일 수도 있고, 0부터 9까지 숫자일 수도 있습니다. 모두가 보기 때문에 기록합니다.
예상점수는 예측컷입니다. 문을 닫을 것으로 예측되는 표본 인원의 점수일 것입니다.
최초합격 가능 인원은 지원 표본에서 최초합격으로 판단되는 인원수를 의미합니다.
추가합격 가능 인원은 지원 표본에서 추가합격으로 판단되는 인원수를 의미합니다. (합격 가능 인원 – 최초합 가능 인원)으로 구할 수도 있고, 편한 방식대로 기록하고 수식을 걸어주면 됩니다.
‘합격가능인원 = 최초합격 가능 인원 + 추가 합격 가능 인원’입니다.
나의 등수와 분석대상자수는 실지원이 예상되는 집계된 모의지원자수와 그 중 나의 순위입니다.
나의 위치는 '나의 등수 / 합격가능인원'을 백분위(%)로 표시하여 나타냅니다. 컷으로부터 나의 상대적인 위치를 가늠할 수 있습니다. 일반적으로 70%를 안정으로 봅니다. 보수적으로는 60%까지 잡을 때도 있습니다. 하지만 때로는 110%도 안정일 수 있습니다. 거시적으로 흐름을 읽는 것이 중요하고, 이 수치의 고평가와 저평가를 읽어내는 것이 실력입니다. 저희 노하우이기도 하고요. '개인'이 제일 어려움을 겪는 분야입니다.
나의 등수 변화는 그 이전에 기록한 ‘나의 등수’와 방금 기록한 '나의 등수'의 차이를 적는 것입니다. 등수가 앞으로 갔을 때 양수로 할 지, 음수로 할 지 등은 편한 방식대로 하시면 됩니다.
컷까지 인원은 나로부터 문 닫을 것으로 예상되는 사람까지 몇 명이 있는지입니다. 합격가능인원에서 나의 등수를 빼서 구합니다. 내 위로 몇 명이 들어오면 자신이 문을 닫게 되는지, 내 앞으로 몇명이 빠져야 내가 문을 닫을 것으로 예측되는지 확인할 수 있습니다.
오른쪽 아래에 윗지표 누적 인원과 내 지표 누적 인원은 표본 상에서 나보다 하나 높은 지표를 받은 꼴지의 순위와 나와 같은 지표를 받은 꼴지의 순위입니다. (본인이 보는 '예측지표'와 같은 지표를 의미합니다) 나의 등수와 비교하여 보면 나의 위치를 조금 더 잘 가늠할 수 있습니다.
전체등수와 전체지원자수는 그 학과를 모의지원한 모든 경쟁자들의 수와 자신의 순위입니다.
예측 지원자수는 예측되는 올해 지원자수입니다.
예측 지원자수를 기입하였다면, 상단에 기록했던 최종모집인원으로 나누어 예측 경쟁률을 구합니다.
적정 누백과 예상 누백은 많이들 보는 누백의 적정 누백(혹은 점수)과 예상 누백(혹은 점수)을 기록하면 됩니다. 적정 대신 소신을 이용하셔도 됩니다. 매번 기록할 정도로 중요도를 갖는 수치는 아닙니다. 굳이 안 보셔도 되고, 앞서 말했듯 누군가는 보기 때문에 같이 확인합니다.
마지막으로,
‘예측 표집비율 = 분석대상자수 / 예측지원자수’,
‘기대 표집비율 = 분석대상자수 / 기대지원자수’로 구합니다.
예측 표집비율과 기대 표집비율은 예측 혹은 기대치 대비 얼마만큼 표본에 경쟁자들이 확인되고 있는지를 확인시켜줍니다. 이 수치가 높다면, 이 학과에 대해 표본의 현실성이 높거나, 실제 표본이 외적·시스템적으로 ‘가정’된 정도를 넘어서고 있거나, 실제지원자들이 많이 들르고 있다는 뜻입니다.
수치들에 대해 설명했으니, 어떻게 보면 좋을지 간략히 다루겠습니다. 설명드렸듯, 수치는 거시적인 흐름이나 가정을 확인하기 위해 관찰하는 것입니다.
1. ‘과거를 바탕으로 기대되는 수치’와 ‘올해 보여지고 있는 수치’를 비교합니다. (통시적)
2. 어떤 정보가 실제 데이터가 아닌 추정에 의해 가정되고 있는지를 살핍니다. (가정)
3. ‘올해 보여지고 있는 수치’의 변화를 관찰합니다. (추이)
4. 하나의 학과가 아닌, 목표 지점의 좌우와 상하의 데이터를 같이 모아서 비교하며 살핍니다. (공시적)
5. 이를 통해, ‘나의 위치’를 ①구조적으로 ②상대적으로 확인하고, 내 경쟁자들이 무엇을 보고 있고, 어떤 판단, 행동, 추이를 보여주고 있는지 / 보일 것인지 잡아냅니다. (가설/시나리오 설정)
필요한 만큼, 가능한 만큼, 할 수 있는 만큼, 하고 싶은 만큼 하시면 됩니다. 부족하다고 생각되면 더 정보를 수집하면 되고, 과하게 느껴지면 덜어내면 됩니다.
커트라인 형성과 폭빵의 원리는 단순하지만, 현실에서 드러나는 양상과 시그널은 꽤나 다변적입니다. 지금까지 말씀드린 방법은 ‘개인’이 여러 상황에서 판을 읽고 능동적으로 판단하기 위해, 최소한으로 확인하면 좋을 ‘수치’들을 모으고 확인하는 방법이었습니다. 열심히 한다고 좋은 결과가 따라오는 것은 아니지만, 열심히 하면 최소한 손해보지는 않는 것이 입시입니다. 저의 이전 글들과 이어질 글을 읽으시면 조금 더 이해가 될 것입니다.
다음 글에서는 위 방법을 통해 실제 사례를 분석해보겠습니다. 감사합니다.
취소분 등의 올해 마지막 정시상담 예약 : 12월 11일 월요일
크럭스상담 우선권을 부여하는 예약신청서 작성 : https://zrr.kr/nERp
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
2025 모의논술 일정 #1 (성대/중대/가대 등) 9
2025 모의논술 신청이 시작됐습니다. 모의논술은 대학의 유형을 인지하고, 자신의...
-
5월 4일 토요일 저녁 6시. 최강논술 X 오르비 5월반이 재개강합니다. 최강논술...
-
마감했습니다. 학림논술 일요일 저녁반 마감했습니다. 최강논술 임호일Pro입니다....
-
드디어 합니다. 오르비에서도. 무료 공개특강! 최강논술 임호일Pro입니다. 5월...
-
최강논술 임호일Pro입니다. ■ 설명회 및 공개특강 일정 ① 4월 17일(수) 저녁...
-
내신, 왜 하는데? 17
“선생님 저 이번주부터 중간고사 대비 들어가요~” 이 친구 서울 일반고, 2학년까지...
-
안녕하세요~ 광쌤입니다. 제 칼럼을 읽어주셔서 감사합니다. 먼저, 제 소개를...
-
지난번의 『원고지 사용법』에 이어, 오늘은 『논술답안 작성법』 들어갑니다. 최강논술...
-
최강논술 임호일Pro, 4월 공개특강과 설명회 일정입니다. 1. 학생 무료 공개특강...
-
'가산점 먹은 과탐' vs '사탐' 분석 자료 - 사탐/과탐 분리 변표 3% VER. 0
안녕하세요. 여러분들의 GT 이승후 입니다. 사탐과 과탐을 분리해서 표준점수를...
-
'가산점 먹은 과탐' vs '사탐' 분석 자료 - 사탐/과탐 분리 변표 VER. 0
안녕하세요. 여러분들의 GT 이승후 입니다. 저번글에는 과탐/사탐 통합변표를...
-
'가산점 먹은 과탐' vs '사탐' 분석 자료 - 7% VER 4
안녕하세요. 여러분들의 GT 이승후 입니다. 저번글에 이어 '가산점 먹은 과탐'...
-
'가산점 먹은 과탐' vs '사탐' 분석 자료 - 3% VER 7
안녕하세요. 여러분들의 GT 이승후 입니다. 저번글에 이어 '가산점 먹은 과탐'...
-
어차피 가산점 먹은 과탐 3등급> 사탐 1등급 입니다 2
일단 제목은 사실이 아닙니다. (일부 대학 빼고 대부분) 안녕하세요. 여러분들의...
-
이 글의 목적은 두 가지입니다. 첫째는, 제 수강생 학부모님들께 제가 수업에서...
-
3월 2일, 토요일 저녁 6시, 인문논술 3월 프로그램이 시작됩니다. 최강논술...
-
안녕하세요~ 광쌤입니다. 제 칼럼을 읽어주셔서 감사합니다. 먼저, 제 소개를...
-
[임호일Pro] 3.1절 인문논술 공개특강! (접수중) 3
3.1절 인문논술 공개특강을 진행합니다. 최고의 강의를 누구나 경험해볼 수 있도록...
-
안녕하세요~ 광쌤입니다. 제 칼럼을 읽어주셔서 감사합니다. 먼저, 제 소개를...
-
안녕하세요~ 광쌤입니다. 제 칼럼을 읽어주셔서 감사합니다. 먼저, 제 소개를...
-
2월 3일, 토요일 저녁 6시! 최강논술X오르비 2월 정규반 개강합니다. 이번달...
-
학생들은 6모 전까지는 보통 자신의 학업적 성취, 그리고 이와 연동되는 지원 가능...
-
논술은 수능최저가 중요해요. 논술을 아무리 잘써도, 최저 미충족이면 탈락이거든요....
-
오랜만입니다. 학아표입니다. 이번 입시에서는 저를 처음 보신 분들이 많을 겁니다...
-
연세대 경영 24학번 ㄱ○○ (87:1) 연세대 경영 23학번 ㅇ○○ (75:1)...
-
안녕하세요. 피오르 컨설팅에서 메디컬라인을 전문으로 하는 종냥이라고 합니다. 이번에...
-
안녕하세요. 피오르 컨설팅의 종냥입니다. 어제 원서 접수가 끝났는데요, 다들 너무...
-
전 서울에 살고 경북대학교 모바일공학과로 재학중인 학생입니다. 요즘 유튜브를 보는데...
-
안녕하십니까. 크럭스 컨설팅 팀 황진표입니다. 상담 기간이 도래하여 여러 자료를 더...
-
고대 이즈 백! 15
“고대가 돌아왔다!” 8년 만에 고려대 논술이 부활했습니다. 덕분에 논술로 연고대...
-
안녕하세요 [CRUX]금산조입니다 교대 정시를 앞두신 분들을 위해 2024교대 정시...
-
아래 링크를 클릭하시면 크럭스 정시상담 예약대기 신청이 가능합니다. 취소분에 대한...
-
[CRUX] 스나 카드 찾기. 반영비가 최우선인가? 3
안녕하세요! 크럭스 조지훈입니다. 정시 원서 접수가 이제 약 2주 앞으로...
-
메디컬 입결과 군을 집약하는 설계의 눈 - 24 백분위 대학편 0
안녕하십니까. 크럭스 컨설턴트 황진표입니다. 저번 메디컬 글에서 예고했듯, 메디컬...
-
안녕하세요 앞으로 하나씩 논술칼럼 하나씩 작성해보려 합니다 지금은 본격 진입시기는...
-
안녕하세요. 크럭스 컨설턴트 이현석입니다. 입시에는 항상 여러가지 변수들이...
-
안녕하세요. 피오르 컨설팅의 메디컬 팀장인 종냥입니다. 글을 시작하기 전에, 이...
-
불펌쟁이가 오늘도 불펌해왔습니다. 이정도면 상습범인 것 같네요. 저희 수석팀장의...
-
수능최저 조건, 내신반영 비율, 수리논술, 영어제시문 등 대학별 문제유형 총정리...
-
https://orbi.kr/00065719331 시작하기 앞서, 사2(사탐2개)로...
-
[들어가는 말] 24수능이 끝나고 사탐공대, 사탐의대가 화제일 때 윤도영 강사의...
-
탐구 변표 3퍼 가산 영향력이 생각보다는 꽤나큰듯? 6
이렇게 되면 가산점 큰 곳은 사탐런이 오히러 불리할지도? 사탐 백분위 99를 받아도...
-
저희 수석팀장 코기토 컨설턴트가 쓴 글 입니다. 검색이 갑자기 되지 않아 글이...
-
안녕하십니까. 크럭스 팀 컨설턴트 황진표입니다. 실채점 이후 예측됐던 컷들이 꽤...
-
* 이 목록에 없는 대학은 사탐 응시자의 지원이 불가함 * 이 목록에 있는 대학은...
-
크럭스(CRUX) 컨설팅 12월 11일 월요일 오후 2시 마지막 예약 오픈 크럭스...
-
2024 대수능 Crux Table (국어/수학) [N2311] 47
★ 자료를 공유하실 때는 반드시 출처를 밝히셔야 합니다. 본 글의 작성자는...
-
2024 대수능 Crux Table (영한탐외) [N2311] 134
★ 자료를 공유하실 때는 반드시 출처를 밝히셔야 합니다. ☆ 국어/수학은 내일...
-
안녕하십니까. 크럭스 컨설팅 소속 컨설턴트 황진표입니다. 저번 글에서 연고대 공대의...
좋은글감사합니다
ㄹㅇ 좋은글.
110%는 10%의 오타인가요?
아닙니다. 해당 수치는 확률이 아니라 누적 등수 개념입니다.
40명 합격 가능할 때 44등이면 110%입니다. 구간 자체가 고평가되어 있으면 110%여도 안정~적정 카드일 수 있습니다. 그런곳을 잘 찾는것이 저희의 강점 중 하나입니다.
글 감사합니다
그런데 예측지원수는 마음대로 정하는 건가요?
많이들 보는 곳의 예측치입니다. 보조도구로써 역이용합니다. 이 예측치가 자꾸 틀려서그런지 작년부터 잘 공개하지 않습니다. 쪽지 주시면 보다 자세히 답변드리겠습니다!