프로그래밍17 [Python] 웹 크롤링 ( Web Crawling ) ### 기본적인 Python을 활용한 웹 크롤링 ### * 정적 크롤링 ( 한 페이지 안에 원하는 정보가 모두 드러남 ) -- 필요한 패키지# 형태소 분석import nltk from konlpy.tag import Kkmafrom konlpy.tag import Okt# wordcloudimport matplotlib.pyplot as plt from wordcloud import WordCloudfrom wordcloud import STOPWORDS import numpy as npfrom PIL import Imagefrom wordcloud import ImageColorGenerator# web crawlingimport requestsfrom bs4 import BeautifulSoup # .. 2022. 4. 3. [Python] WordCloud # wordcloud 아나콘다 설치: anaconda prompt 관리자권한으로 실행 -> conda install -c conda-forge wordcloud -- wordcloud 예제 1 ( 기본 사각형 ) import matplotlib.pyplot as pltfrom wordcloud import WordCloudfrom wordcloud import STOPWORDS # 불용어 처리text = open("텍스트 이름.txt").read()stopwords = set(STOPWORDS)stopwords.update(['추가할 불용어 입력'])wordcloud = WordCloud(max_font_size = , # 이미지 내의 최대 font 크기 max_words = , # 이미지 안.. 2022. 4. 3. [Python] 입력값이 잘못됐을 때 코드를 다시 실행해보자 기초 파이썬 멘토링을 진행하던 도중 멘티 한분의 질문이 있었다. 그 질문은 "주어진 문제에서 입력값을 input()으로 받아줄 때 원하는 범위의 값을 입력받지 못하는 경우 다시 코드를 실행할 수 있나요?" 였다. 물론 가능하다. 하지만 보통 백준을 풀거나 과제를 진행할 경우 해당 조건에 맞는 값이 입력되기 때문에 가능하다고만 생각해보았지 직접 코드를 짜본적은 없었던 것 같다. 그래서 이번 기회에 한번 구글링도 해보고 코드를 짜보는 시간을 가졌다. - 시간과 분을 받는 코드를 만들어보자! 시간은 0 1. 파이썬의 내장 클래스인 Exception을 상속받아 사용자 지정 오류 class를 만들어준다.2. 만든 사용자 지정 오류를 호출하는 함수를 만들어줍니다.# 사용자 임의로 error만들기class my_.. 2022. 1. 9. [Python] Pandas의 Series와 DataFrame # Pandas 기존에 알고 있던 지식을 제외 새롭게 알게 된 내용만 기록~!!! Series - pd.Series({인덱스명 : 값)}으로 Series 생성 시 인덱스 명을 지정해 줄 수 있다. - [ : ] Series 또한 슬라이싱으로 원하는 값만 추출할 수 있다. -- Series 형태인 x가 존재 할 때 -- - x[x > x.median(중앙값)] 처럼 조건으로 원하는 값만 추출이 가능하다. - dictionary형태와 마찬가지로 x.['인덱스명'] = 값 으로 Series를 추가할 수 있다. x.get('인덱스명',0) 처럼 dictionary에서 사용하는 get 메소드를 이용해 표현 가능하다. - Series는 name 속성을 가지고 있어 Series를 생성할 때 name을 붙여 줄 수 있.. 2021. 7. 14. [Jupyter] 주피터 노트북 단축키, 마크다운 문법 유용한 단축키 초록색 테두리 : 입력 모드 ( Enter ) 파란색 테두리 : 명령 모드 ( Esc ) 명령 모드에서 -> M 마크다운 입력 모드로 변경 -> Y 코드 입력 모드로 변경 -> A 위에 셀 추가 -> B 아래에 셀 추가 -> DD 현재 셀 삭제 -> L 코드 number 표시 -> X 잘라내기 -> Z 되돌리기 -> F 단어 찾아서 바꾸기 입력 모드에서 -> ctrl + enter 셀 실행 -> shift + enter 셀 실행 후 커서 아래로 -> ctrl + shift + - : 커서를 기준으로 셀을 위아래로 분리 -> shift + tab : 해당 함수에 들어가는 인자 확인 가능 -> tab : 해당 단어로 시작되는 함수 확인 가능 Markdown 문법 1. # 1개 ~ 6개까지 he.. 2021. 7. 13. 이전 1 2 3 다음