KT 에이블스쿨 : 2차 미니프로젝트 - 서울시 버스 공공데이터 활용

     





    프로젝트 목적 : 서울시 버스 노선 추가 

    kt 에이블스쿨에서 준 2차 미니프로젝트은 관련된 공공데이터를 활용해서 프로젝트를 진행했다.  

    3일동안 진행하면서, 우리조는 3일 풀로 대면 프로젝트를 진행했다. 

    오고가고가 힘들긴했지만, 확실히 비대면보다는 인사이트를 많이 공유할 수 있어서 좋았다. 

    덕분에 미프 발표에서 강사님께 좋은 평을 받으면서 마무리 할 수 있었던 것 같다. 




    추가 솔류션 기획 

    우리 조는 미니프로젝트에 더해서 우리조만의 솔류션을 기획했다. 

    올빼미(심야) 버스 이후인 새벽4시부터 6시에는 아래와 같은 수요가 있으나, 아직까지 버스가 운행하고 있지는 않은 상황 

    - 이른 새벽에 출근할때 대중교통의 부재

    - 지방간 이동을 위해서 이른 시간에 출발해 고속버스터미널, 고속철도역으로 가는 경우가 있음


    심야버스(0시~4시)가 종료된 후 ~ 첫차 전까지에도 버스를 이용할 수있도록 하면 어떨까? 라는 생각으로 프로젝트를 시작하게되었다 


    현재 서울시에서 새벽시간에 세계 최초로 자율주행 버스를 운행 중이나, 노선이 하나밖에 없다는 한계점이 존재함 


    이른 새벽 시간대에는 자동차나 사람의 이동비율이 현저히 적기때문에, 자율주행 운행이 비교적 용이하다고 판단함

    또한, 자율주행으로 운행하면 운전자의 인건비를 줄일 수 있어 이른 시간대 승객 수가 적더라도 경제적 손해가 없을 걸로 보았음


    Early Bird 버스

    그래서, 우리 조는 이른 시간대에 운행하는 early bird 버스를 기획했다.  

    "서울시 24시간 버스 운영을 위한 자율주행 Early bird 버스"

    주로, 자치구 시간대별 이동인구 정보, 정류장별 승하차 정보, 정류장별 위치 데이터를 활용해 데이터 분석 및 시각화를 진행함 





    데이터 분석 과정 

    1. 시간대 4~6시에 어느 자치구에 많이 도착하는지  

    - 1.2 구별 유동인구 데이터 활용



    우선, 4시~6시 시간대로 필터링하고, 

    도착자치구를 기준으로 이동인구(합)을 groupby로 구함  

    그 중 상위 5개 자치구 출력   


    - 1위 : 강남구

      2위 : 송파구 

      3위 : 서초구 

      4위 : 강서구 

      5위 : 영등포구 





    2. 위 도착자치구를 가기위해서, 어느 지차구에서 출발하는지

    - 1.2 구별 유동인구 데이터 활용

    시간대는 4~6시 

    도착자치구는 위의 데이터로 나온, "강남구, 송파구, 서초구"로 설정하고

    출발자치구별 이동인구 합을 groupby 함


    위에서 상위 5개 자치구 

    - 1위 : 송파구

      2위 : 강남구 

      3위 : 서초구 

      4위 : 강동구

      5위 : 관악구 





    3. 강남, 송파, 서초구에 4시~6시 순환버스가 있으면 좋을 것 같다 


    이른 새벽시간대에 이동인구가 많은 자치구는 출발지와 도착지 

    상위 3개가 강남, 송파, 서초구로 동일하게 나옴


    그러므로 서초-강남-송파를 잇는 노선을 추가하면 효율성이 높을거라는 판단을 함



    4. 자치구 정거장 별 승차하승객수가 많은 정거장은 어디인가 ? 

    상위 3개 자치구인 서초, 강남, 송파구에 노선을 추가할때

    이용 승객이 많은 정거장을 잇는다면, 가능한 많은 사람들에게 도움이 되는 노선이 될 수 있을거라 생각했음 


    그래서, 버스정류장 번호와 정류장 이름이 들어있는 데이터 

    + 버스정류장 별 근처 역명, 승하차 승객 수, 노선명이 들어있는 정보 데이터

    + 버스정류장 별 위치(위도경도) 데이터를 활용했음


    분석하기에 앞서 세개의 데이터프레임을 전처리하고 합쳤음


    1)  구별 버스정류장 분석 데이터 




    2) 버스정류장 정보 + 정류소명 합침 





    3) 정류장 ARS 고유번호의 위도경도(X, Y좌표) 데이터와 정류장 정보 + 승하차 승객수를 합침

    기존 실습파일에 위도경도를 합치기위해서 정류장별 위도경도를 나타내는 공공데이터를 추가 활용함 (URL

    정류장별 위도경도를 나타내는 공공데이터


    정거장별 정보 + 승하차 승객수 + 위도경도  

    서울시 버스정류소 위치 데이터(20180502).xls의  위도경도 데이터랑 버스정류장 정보 데이터랑 합침



    4) 강남, 서초, 송파구 별 승하차 승객수가 많은 정류장 추출




    인사이트 도출

    4. 송파, 강남, 서초구의 유동인구가 많은 버스정류장은 역 근처

    역명을 기준으로 메인 지하철역(강남역, 역삼역 등), 고속철도역(수서역, 용산역 등), 고속터미널에 이용자가 많은걸로 나옴


    이를 통한 인사이트로는 교통 환승을 위한 역을 이용하는 승객 수가 압도적으로 많다는걸 알게됨 


    강남

    송파

    서초



    5. 지도 시각화

    인기 정류장의 위도경도 데이터를 활용해서 지도로 시각화를 했다. 


    forium 지도 시각화 라이브러리를 사용했으며, 마커로 주요 정거장을 표시했는데, 

    발표할때, 이 지도 시각화한거를 시현하지 못한게 너무 아쉽다... 

    링크 연결오류로 못보여줬다 .. ㅠ 


    지도 시각화

    시각화 결과, 집중적으로 모여있는 역은 위와 같다

    위의 마커를 토대로, 이른 새벽에 운행하는 버스노선을 추가하는게 필요해보임 


    하지만, 중간에 강이 흐르고 다리가 많은 서울의 지리적 특성을 고려해 노선을 추가할 필요가 있음 

     


    기대효과

    1. 자율주행 

    자율주행 데이터를 확보하고 실 운영하면서 노하우를 키울 수 있을것으로 봄

    또한, 자율주행 함으로써 운전자 인건비 절감 가능 


    2. 대중교통 편의성 확대

    이른 새벽에도 대중교통을 도입함으로써 자차 사용을 줄일 수 있다고 보여짐 




    한계점

    현재 서울시는 운행 가능한 버스를 한계하는 버스 종량제도가 있음 

    따라서, 이른 새벽에 추가 노선을 개설한다면, 기존의 노선을 일부 없애야하는 한계가 존재함 


    해결방안 

    버스 종량제에 대한 해결방안으로, 제도법규를 최신화해 유연하게 적용할 필요가 있어보임


    아쉬운 점 

    버스 정거장 데이터를 합칠때, 이른 새벽시간(4~6시)에 어느 정거장을 많이 사용하는지 확인을 해보고 싶었으나

    버스정거장 데이터와 이용 시간대 데이터는 접합점이 없어 합치지 못했음

    시간대별 버스정거장 이용 데이터가 있다면, 더 구체적이고 신뢰성을 높일 수 있다고 봄









    ======================================



    발표 후기..  

    처음으로 많은 사람들이 있는 곳에서 발표를 했돠,,,

    발표하기전에 준비할 시간이 많이 없어서 걱정도 되고

    긴장해서 심장은 바운스 바운스 했지만 결국 하긴했다 !! 


    이번 발표에서 아쉬웠던 부분

    - 구어체

    습관적으로  “~하게 되더라구요” 같이 구어체를 쓰는걸 알게됨 

    발표하는 건 공식적인 자리에서 하는거니까 구어체보단 

    “라고 합니다”, “~로 보여집니다” 처럼 말하는게 좋아보임


    - 발음

    “차량종량제”랑 무슨 단어를 읽을때, 발음이 꼬여서 전달력이 부족했다고 생각함

    익숙하지 않은 단어는 계속 말해서 발음에 익숙해지도록 하는게 좋을 것 같다


    - 링크 연결 문제

    시각화한 링크가 제대로 연결이되는지 확인을 안해서, 결국 링크를 열어서 동적으로 보여주진 못한게 아쉬웠다

    발표를 시작하기전에 영상, 이미지, 폰트, 링크 등 동적으로 바뀌어지는건 여러번 재확인이 필요하단걸 느낌


    - 똑같은 단어 반복

    같은 뜻이더라도 동의어나 비슷한 말로 바꿔서 발표를 하면 반복적이게 말한다는 느낌을 받지않을것같은데

    똑같은 단어를 계속 반복적으로 사용해서, 같은 말한다고 생각할 수도 있을것같음

    (Ex, “노선 추가”라는 말을 “신규 라인”, “추가 노선 배치” 등 다양한 말로 바꿀수있움) 


    - 강조할려고 한 단어를 강조 못함

    프로젝트 목적에 맞는 이른 새벽에 자율주행하는 버스이름을 

    Early bird 버스명로 지었는데, 말도 못꺼내서 임팩트를 주는게 낫았다고 생각함


    - 발표 도중 질문

    사람들의 호응을 유도하기 위한 질문이 아니라, 지도시각화에서 서초구 위치가 어디인지 헷갈려서 “여기기 서초구가 맞나?” 로 물었음ㅋ 서초구랑 송파구 위치가 헷갈려서 미리 확인하긴 했는데, 발표하면서 까먹어서 문제였음

    이렇게 준비했던게 까먹으면 그냥 내뱉고보기 


    - 마무리 멘트

    식상하게 “감사합니다”로 끝냈는데, 다르게 말하는게 좋을듯함

    “31조 발표를 들어주셔서 감사합니다. ”

    “모두들 프로젝트하는데 수고 많으셨고, 31조 발표를 들어주셔서 감사합니다. 이상 발표를 마치겠습니다” 가 더 마무리가 잘 지어진 것 같아서 전문성 있어보임

    “ 데이터를 분석하고 가설검증,  변수관계 분석을 통해 솔류션을 제안하는 과정에서 많이 성장할 수 있었던 2차 미프였습니다. 발표를 들어주셔셔 감사합니다” 


    이 외에도 고칠건 많을 것 같은데 잘 기억이 앙낭다 


    강사님의 피드백

    발표를 좀 떨어서 아쉬운게 있었는데, 강사님이 특급칭찬을 해줘서 부끄럽기도 하고 뿌듯하기도 했다 ! 

    1기부터 지금 5기인 전체 기수동안 이 프로젝트를 우리처럼 생각해서 솔류션을 기획한게 처음이라고 말씀해주시면서, 

    다른 매니저님들한테 우리 31조 자랑하겠다규 ㅎ ㅎ ㅎ 

    흐흐 

    빈말이라고 해도 너무 행복크





    미프의 마무리 

    사람들이 많더라도 기죽을 필요가 없다고 생각한다

    연습을 위해서 도전 하는거고 못해도 뭐라고 하는 사람이 없기때문 

    나혼자 기죽고 의기소침해져서 목소리가 작아지지 말것

    뭐든 자신감이 있어야 반은 먹고 들어가는 듯 



    부족한 발표 실력이지만, 계속 발표를 해보면서 내가 고칠점들을 고쳐나갈려고 노력하다보면

    언젠가 나도 발표를 잘하게 되지않을까 하는 ㅎ 바램이 있다 

    킵고잉잉잉


    다른 분이 내 발표하는 모습을 캡쳐해주셨는데,,,

    난 내얼굴이 저렇게 부담스럽게 나오는지 몰라따,,ㅋㅎ

    듣는 사람들 깜짝 놀랬을듯 ㅠㅎㅠ








    아래는 깨알 킬링타임




    3일이라는 짧은 시간동안 많이 배웠다 ! 



    댓글

    이 블로그의 인기 게시물

    [KT 에이블스쿨 - IT 트랜드] 국내외 AI 관련 규제

    KT 에이블스쿨 : IT 인프라 (1일차~5일차) 공부 정리

    KT 에이블스쿨 : 핀테크 아이디어 공모전