본문 바로가기

제로베이스 데이터 스쿨/일일 스터디 노트42

26일차 스터디노트 / 파이썬 웹데이터 수집, 파이썬 Selenium, 주유 가격 정보 시각화, boxplot, folium ※제로베이스 데이터 취업스쿨 11기 수강 중 📗 26일차 공부 내용 요약 파이썬에서 웹데이터를 수집하기 위해, 셀레니움에 대해 알아보고, 유가 데이터를 수집하고 시각화해보았다 1. 셀레니움(Selenium) : 셀레니움의 필요성을 알아보고, 기초적인 동작들을 알아보았다. 2. 한국석유공사 Opinet 데이터 수집 : 셀레니움을 통해 유가 데이터를 수집해보았다 3. 주유 가격 데이터 정리 : 수집한 다수의 엑셀 파일을 불러오고, 데이터프레임으로 변환해보았다 4. 주유 가격 정보 시각화 : boxplot과 지도 시각화를 진행해보았다. 📖 26일차 공부 내용 자세히 1. 셀레니움(Selenium) ■ selenium webdriver 사용하기 #selenium 패키지에서 webdriver 기능을 가져온다 fr.. 2023. 2. 7.
25일차 스터디노트 / 파이썬 웹데이터 수집하고 정리하기, Beutiful Soup, 네이버금융·위키백과·시카고 맛집·네이버영화 데이터 수집 및 정리 ※제로베이스 데이터 취업스쿨 11기 수강 중 📗25일차 공부 내용 요약 파이썬을 활용해 웹데이터를 수집하고, 정리하여, 시각화하는 법을 학습했다 1. BeautifulSoup : BeautifulSoup으로 html 불러오고, 원하는 태그를 찾는 법을 학습했다. 2. 네이버 금융 데이터 수집/정리 : urllib의 requests 모듈을 활용해 웹주소에 접근하는 법을 학습하고, 네이버 금융데이터를 수집해보았다. 3. 위키백과 데이터 수집/정리 : URL값이 깨질 때 인코딩하며 불러오는 법과, 동일한 태그가 많을 때 원하는 값을 찾는 법을 학습하고 위키백과에서 데이터를 수집했다. 4. 시카고 맛집 데이터 수집/정리 : fake_useragent를 활용하는 법, Regular Expression을 학습하고,.. 2023. 2. 6.
24일차 스터디노트 / 파이썬 Seaborn, Folium, 지도 시각화, 데이터 시각화 ※제로베이스 데이터 취업스쿨 11기 수강 중 📗 24일차 공부 내용 요약 Seaborn과 Folium을 활용한 데이터 시각화 방법에 대해 학습하고, 지난번 정리했던 서울시 범죄현황 데이터를 시각화해보았다. 1. Seaborn : set_style(), boxplot(), swarmplot(), lmplot(), heatmap(), pairplot() 2. 서울시 범죄현황 데이터 시각화 : Seaborn 라이브러리를 활용한 데이터 시각화 3. Folium 지도 시각화 : Map(), fMarker(), Icon(), fClickForMarker(), LatLngPopup(), Circle(), CircleMarker(), Choropleth() 4. 서울시 범죄현황 지도 시각화 : Folium 라이브러리를.. 2023. 2. 3.
23일차 스터디노트 / 판다스 데이터 분석, Google Maps 활용, 피봇테이블, 서울시 범죄 데이터 정리 ※제로베이스 데이터 취업스쿨 11기 수강 중 📗 23일차 공부 내용 요약 1. 데이터 살펴보기 : 서울시 범죄 데이터 2. Pandas pivot_table 3. 데이터 정리하기 : 다중 컬럼에서 특정 컬럼 제거 4.Python 모듈 설치 : pip 명령, conda 명령 5.Google Map API 설치 6.Python의 반복문 : list comprehension, iterrows() 7.Google Maps 이용한 데이터 정리 📖 23일차 공부 내용 자세히 1. 데이터 살펴보기 : 서울시 범죄 데이터 천단위 구분 제거하고 숫자로 인식하기 → thousands = ‘,’ 1000단위 이상 숫자들은 콤마(,)를 사용하고 있어 문자로 인식될 수 있음 천단위 구분(thousands = ',')이라고 알려.. 2023. 2. 2.