[TIL] 25.03.21 웹크롤링으로 버스 출발시간표 데이터 구하기
·
Today I Learned
오늘 한 것: 출발 시간표 크롤링 - 걸린시간이 전부 있는 버스 40개의 도착 예정 시간을 구하려고 하니.. 출발 시간 데이터가 없었다.. 평일, 주말에 언제언제 기점에서 출발하는 시간이다. 그래서 구미 BIS(버스시스템) 홈페이지에서 크롤링을 할 수 밖에 없었다프로세스크게 3가지 단계웹 드라이버 생성 -> HTML 태그에서 정보 찾아서 리스트에 담기 -> 시간표 웹 사이트로 이동해서 정보 크롤링 자세히는 9가지 단계이다.셀레니움으로 웹드라이버 생성(나 대신 웹페이지 열어서 크롤링 해줄 친구)웹페이지 HTML에서 모든 버스 노선 찾기버스 노선별로 시간표로 들어가는 URL 찾기(웹페이지 한 번 더 열어야 시간표 확인 가능)버스별로 번호, 주요경유지, 시간표 URL, filename 만들기시간표 수집함수 정..