12월 12일 시상식을 마지막으로
9월부터 열심히 달려왔던 빅콘 공모전이
마무리되었습니다!
감사하게도 저희 팀은 대상🏅을 받을 수 있었습니다🤩
이번 대회를 준비하면서
기록의 중요성을 더더욱 느끼게 되었는데
대회를 준비했던 과정을 남겨두는 것도 의미 있을 것 같아 이렇게 글을 적어봅니다
궁금하신 점 있으면 댓글로 남겨주세요!
그리고 저희 팀 에이스 츄 학생의 글도 함께 읽어주신다면 좋을 것 같습니다 🤩✨
https://blog.naver.com/1208_s2/223695562808
대회 소개 |
아마 데이터 분석이나 통계 분야에 익숙하지 않다면 잘 모를 수도 있겠지만,
빅콘테스트는 데이터 분석 분야에서 상당히 규모가 크고 오래된 공모전입니다!
통계학과 대학원에 재학하면서 많은 선배들이 수상했다고 들었고,
저도 꼭 한 번은 나가야겠다고 생각했습니다
24년의 대회 일정은 위와 같습니다
후기를 읽어보거나 선배들 말을 들어보면
대회 일정이나 심사 방식은 매년 조금씩 변경되는 것으로 보입니다
대회 준비 과정 |
먼저 팀원을 구성했는데
저희는 다 같은 대학원 동기로 자연스럽게 팀이 구성되었습니다 ^.^
4명이서 한 팀이 되어 으쌰으쌰했습니다
그다음으로는 분야와 주제 정하기였습니다
세 가지 분야가 있는데 저희는 데이터 활용 분야의 지정주제 - 공간융합 주제를 선정하여 진행했습니다
tmi) 원래는 스마트팜을 주제로 진행했지만... 데이터를 어떻게 처리해야 하는지, 이 데이터로 어떠한 인사이트를 도출해야 하는지 감이 잡히지 않아 진행했던 프로젝트를 멈추고 새로운 주제인 공간융합을 선택했습니다 .. 🫠
그래서 스마트팜을 주제로 한 팀이 한 결과물이 궁금하기도 합니댱ㅎㅎ 어떻게 이 데이터로 주제를 풀어나갔을지 알고 싶어요 🥹
거의 스마트팜 데이터로 2-3주를 진행했어서 아쉽기도 했지만 결과적으로는 더 좋은 선택이었다고 생각합니다
분석 과정은
데이터 전처리 >> 클러스터링 >> 모델링 >> 클러스터별 결과 해석 >> ppt
순으로 진행되었습니다
📍데이터 전처리
데이터 전처리 과정은 크게 제공 데이터 전처리와 외부 데이터 전처리로 나눌 수 있습니다
제공한 데이터를 처리하기 위해 정말 많은 과정을 거쳤는데... 너무 많아서 나열하기 힘드네요.. ^^
대회 중간에 데이터가 완전히 바뀌는 그런 일도 있었지만..
그래도 머리를 모아 가장 좋은 방법을 찾았습니다
외부 데이터 사용은 선택 사항인데
저희는 조금 더 좋은 분석을 위해
논문이나 자료를 기반으로 외부 데이터를 사용했습니다.
(다른 팀이 몇 개의 외부 데이터를 사용했는지는 잘 모르지만)
저희는 외부 데이터를 많이 사용했다고 생각하는데 그래서 더 좋게 봐주신 것도 있는 것 같습니다
이번에 공모전을 준비하면서 데이터 분석은 정말 데이터를 수집하고 전처리하는 게 절반이라는 걸 뼈저리게 느낀 것 같아요 ^^
데이터를 선택하고 찾고 수집하고 처리하는 게 저희 과정의 거의 60%는 차지했던 것 같습니다 ..
📍클러스터링&모델링
클러스터링과 모델링은 이미 다른 분들도 너무 잘 하시니까 자세하게 설명드릴 건 없을 것 같습니다🥹🥹
간략하게 설명드리면 모델 예측 성능을 높이기 위해 부스팅 계열의 모델을 사용했고 튜닝을 통해서 테스트 데이터에서 가장 성능이 좋은 모델을 선택했습니다!
모델링 후 feature importance와 pdp를 통해 변수별 영향도를 확인했습니다
공간융합 주제의 분석 목표는 아파트 가격의 결정 요인을 분석하는 것이었는데요
분석 목표에 맞게 데이터 분석을 통해 나온 결과를 잘 해석하는 것이 중요하다고 생각했습니다
그래서 분석 결과 + 부동산 상황 + 여러 도메인 지식을 결합해서
결과를 듣는 사람들이 납득할 만한 해석을 제공하려고 노력했습니다!
사실 저희는 부동산 지식은 거의 0에 가까운 사람들이라서
저희가 제시한 결과 해석이 일반적으로 납득할 만한 결과인지 아닌지 계속 고민했던 것 같아요
저희 해석에 근거를 부여하기 위해 여러 논문, 보고서를 찾아보고 현실성도 확인하기 위해 부동산 커뮤니티나 부동산 유튜브도 열심히 찾아보았습니다!
그랬더니 모든 알고리즘이 부동산으로 점령당해 모든 광고가 부동산 광고로 뜨기도 했답니다...🫠 ㅋㅋ
📍ppt
마지막으로 ppt 디자인은 저희의 에이스 ppt 깎는 츄 학생이 전적으로 담당했는데요 ( 츄 최고 🤩)
https://blog.naver.com/1208_s2/223695562808
이 글을 읽어보면 ppt 제작 과정을 좀 더 자세히 알 수 있습니다 ^^
다른 팀원들은 백지ppt를 만들고
추합과 디자인은 한명이 담당해서 좀 더 통일성있는 결과물이 나올 수 있었습니다
이 과정에서 증말 증말 수많은 회의가 있었습니다 🫠
(기록되지 않은 회의들이 가득.. )
마지막으로 갈수록 매일매일의 회의의 연속이었다고 보면 될 것 같아요
그냥 눈 마주치면 회의하기
저희는 같은 연구실을 사용하는 대학원생이라서
공모전 준비하는 데 시간을 좀 더 많이 할애할 수 있었고 진행도 수월했던 것 같아요
그리고 한 가지 이슈가 있었다면.. 원래 최종 마감일은 10월 25일이었는데요
갑자기 마감 당일 오후 1시에 .. 마감일이 3주 정도 연장되었다는 공지가 올라왔습니다..
저희는 그날 마감을 위해 밤을 새웠는데 정말 정말 당황스러웠어요 🫠
당황스러웠지만.. 계속 공모전을 준비해야 하니까
일단 잠시 하던 일을 멈추고 저희가 했던 분석을 재정비하는 시간을 가졌습니다
사실 분석 진행하면서 아쉬운 점들이 꽤 있어서 그런 것들을 수정하고 개선했습니다
지금 와서 보면 그때 연장되지 않았더라면 지금처럼 좋은 결과물이 나오지 않았을 것 같아요.. ^^
다시 되돌아가는 시간이 있었기에 좀 더 좋은 결과가 나올 수 있었던 것 같습니다
심사 과정 |
1차 합격 후 2차 발표 심사를 준비했습니다
발표 심사에서는 서류 심사에서 제출한 ppt를 그대로 사용하였습니다.(제출한 ppt는 변경 금지)
발표 심사는 발표 15분, 질의응답 10분으로 진행되는데
발표 시간을 타이머로 정확히 계산해서 발표 시간을 잘 지키는 게 중요한 것 같습니다
(참고로 발표는 한 사람이 하고, 질의응답은 팀원 전체가 참여할 수 있었습니다)
저희 ppt는 약 60장 정도로 내용이 많았기에
발표 시간을 맞추기 위해 대본 작성부터 발표 연습까지 꼼꼼하게 준비했습니다
연습할 때 14분 정도로 준비했을 때 현장에서 발표 시간을 딱 맞출 수 있었습니다
발표 장소는 강남역 근처에 있는 한국정보통신진흥협회 건물이었습니다
공지한 발표 시간에 맞춰 발표장으로 가면 됩니다!
발표 심사는 비공개로 이뤄지며 다른 팀의 발표는 볼 수 없었습니다
(다른 팀은 어떻게 했는지 궁금했지만.. 볼 수 없었습니다)
심사위원은 7명이었고, 심사위원마다 모니터를 통해 발표 자료를 보고 계셨습니다
그래도 모니터가 있어서 그런지 발표에 대한 부담은 조금 덜어지는 느낌이었어요 ..
발표 담당 친구가 정말 정말 발표를 잘 해준 덕분에 발표를 잘 끝낸 후
질의응답 시간을 가졌는데 저희가 받아들이기에 심사위원 반응이 약간 애매하게 느껴졌습니다 .. ^^
좋은 사인도 있었고 애매한 사인도 있어서 대상을 받을 수 있을지 확신이 들지 않아 마지막까지 긴장을 놓을 수 없었습니다
시상식 및 대회 후기 |
2차 발표 심사 결과는 다음날 바로 나왔습니다
다행히 2차도 합격!
발표 결과가 나기 전까지
과연 받을 수 있을까? >> 우리가 아니면 누가 받지? >> 아 근데 좀 애매한데..>> 아냐 근데 우리 진짜 잘했는데..
무한 반복 루트였는데 수상은 확정되어서 너무 기뻤습니다
상훈은 시상식에서 알 수 있어서 마지막까지 많이 떨리더라고요
기대를 많이 하면 안 되지만... (like 스파이더맨 MJ)
마음 한편에는 대상을 받고 싶다는 소망이 있어서 조금은 기대도 되고 떨리기도 했습니다
드디어 시상식 날!
앞서 말씀드린 것처럼 대상을 수상할 수 있었습니다!
최우수상 수상한 윤현민우 팀도 축하합니다 🤩
이대 통계 짱 ~ !
tmi)
근데 발표 대기장에서도 , 발표 질의응답 시간에도 시상식에서도 팀명을 궁금해하셨습니다
ㅋㅋㅋㅋ
소잘우 미숫가루맛 = 매일유업 소화가 잘 되는 우유 미숫가루맛 으로..
정말정말 맛있어요
처음 먹어보고 충격 먹어서 지금까지 연구실에 n차 공동구매를 추진했습니다 ^^
매일유업은 나한테 마케팅 비용이라도 줘야 하는 거 아니냐며 ~
AI 분야에서 대상을 받은 팀은 발표를 준비하라는 말을 들어서 대상인 것을 약간 예상하고 있었을 것 같은데
저희 분야는 그런 언질이 없어서 더 떨렸던 것 같아요
9월부터 12월까지 공모전을 준비하면서 주제도 바꾸고 데이터도 바뀌고 코드 실수로 다시 원점으로 되돌아가기도 하고 마감일도 미뤄지고 정말 많은 일이 있었는데요
정말정말 힘들기도 했지만 이렇게 눈에 보이는 성과를 얻을 수 있어서
마지막까지 공모전을 마무리해서 정말 뿌듯하고 기쁩니다
준비하면서 저 스스로 부족한 점도 정말 많이 느꼈고
배운 점도 정말 많았던 것 같아요
이번에 배운 내용을 기반으로 더욱 성장하도록 노력해야겠다고 생각했습니다
그리고 소잘우 미숫가루맛 팀원들..
만나면 회의 뭐 하나 끝나면 회의 .. 공모전 기간에 거의 이렇게 살았던 것 같아요 ..
같이 너무너무 고생한 친구들에게 무한한 감사 인사를 드립니다
함께 보면 좋을 콘텐츠 |
||||||||||||||||
└삼성전자 면접관, 현대자동차 인사담당자 등 원하는 멘토를 선택해 답변을 받을 수 있습니다 😎
해당 게시글은 링커리어 회원님들이 남겨주신 소중한 후기입니다. 해당 게시글에 포함된 내용에 대한 악의적인 비방 및 비하, 욕설이 담긴 댓글을 남길 시 무통보 활동정지 및 탈퇴 처리됩니다.
본 사이트의 합격후기 및 자료들을 무단 복제, 배포하는 경우에는 저작권법 제 97조의 저작재산권침해죄에 해당하며, 저작권법에 의거 법적조치에 처해질 수 있습니다.
작성자 링커리어
신고글 [한국정보통신진흥원] 2024 빅콘테스트 AI 데이터 분석 활용 경진대회 수상 후기
- 욕설/비하 발언
- 음란성
- 홍보성 콘텐츠 및 도배글
- 개인정보 노출
- 특정인 비방
- 기타
허위 신고의 경우 서비스 이용제한과 같은
불이익을 받으실 수 있습니다.