https://github.com/sseyeon/WebCrawling

공항 인근 여행지 정보 크롤링

출처 : 대한민국 구석구석 홈페이지 (https://korean.visitkorea.or.kr/main/main.do)

'대한민국 구석구석' 홈페이지의 #관광지, #문화시설, #쇼핑 카테고리를 대상으로 웹 크롤링(web crawling)을 이용하여 여행지 정보를 수집하였다.

'웹 크롤링'이란, 표준 웹 브라우저를 통해 엑세스 할 수 있는 콘텐츠 정보를 수집하는 과정을 말한다. 이 과정에서 웹 페이지의 소유자가 거부한 페이지나 내용을 포함하할 수 있기 때문에, 로봇 배제 규약에 따라 웹 페이지의 소유자가 거부한 페이지와 내용을 명시한 "robot.txt"를 준수하여 정보를 수집하였다.

웹 크롤러는 데이터 분석 프로그래밍 언어인 Python 언어와 Python의 라이브러리인 Beautiful Soup를 이용하여 프로그래밍 하였다.

여행지 정보 - 데이터 수집

화면 확대 ,,

화면 확대 ,,

그냥 화면 확대 2

그냥 화면 확대 2