반응형 개발 Tools92 머신러닝 KFold (n_splits) 우리가 데이터를 주고 훈련을 시킬 때, 일정 부분은 훈련만 시키고 이게 잘 훈련됐는지 판단할 검증 데이터가 있어야 합니다. 우린 수능을 보기 위해 모의고사를 준비합니다. 모의고사 == 학습 수능 == 검증 나에게 5개의 시험지가 주어졌다면, 4개는 풀면서 오답도 체크하고 풀이법도 익힙니다. 그리고 나머지 1개로 내가 지금까지 공부를 잘했나 평가하는 것입니다. 머신러닝에서는 데이터를 나누는데 여러가지 방법이 있습니다. 하나의 방법 중 하나인 KFold를 이용해보겠습니다. 라이브러리 필요한 라이브러리를 불러 옵니다 from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.metrics i.. 2021. 7. 13. webcrawling (웹크롤링) 네이버 기사 (시간, 타이틀, 링크) 크롤링 ( find, find_all, attrs, a["href"]) 이번엔 여러 회사의 최신 뉴스를 검색해서 링크를 적는 일이 주어졌다 그래서 간단히 크롤링을 이용하여 만들어보았다. (첫 페이지만 끌어온다) 라이브러리 먼저 필요한 라이브러리를 불러온다 import requests from bs4 import BeautifulSoup 2개의 라이브러리 밖에 사용하지 않는다. 뉴스에 검색할 키워드 리스트에 담기 네이버 뉴스의 검색했을 때 url을 먼저 보겠다 url = https://search.naver.com/search.naver?query={검색 키워드}&where=news&ie=utf8&sm=nws_hty 이런 식으로 돼 있다. query="검색 키워드" 라 반복문을 사용하여 여러 검색 키워드를 볼까 한다. 이번에는 ["삼성", "sk하이닉스", "토스", "카카오.. 2021. 7. 13. webcrawling(웹 크롤링) 기본 (requests, headers, get(), raise_for_status(), beautifulsoup ) 웹 크롤링이란, 웹사이트를 구성하는 HTML을 가져오는 것이다. 그리고 그 안에서 원하는 정보를 가져올 수 있다. 차근차근해보겠다. 라이브러리 import 먼저 크롤링에 필요한 라이브러리는 "requests"이다 import requests 객체 생성 이렇게 필요한 라이브러리를 불러 왔다. 다음은 객체를 생성하는 게 당연한 순서이다. 객체란, 형태를 가진 뭔가를 만든다고 생각하면 된다. 한번 출력까지 해보겠다. res = requests.get("http://naver.com") print(res) 출력 res라는 객체를 생성했다. 우린 get() 함수를 써서 네이버 홈 화면의 HTML 코드를 가져왔다. get() 안에 내가 원하는 주소를 적어준다. 그런데 출력이 "" 이라는 이상한 출력문이 나왔다. 이.. 2021. 7. 13. python lambda 함수 사용법 ( map(), if else ) 안녕하세요! 이번에는 '익명 함수'라고 불리는 lambda 함수에 대해 알아볼까 합니다 lambda 함수 기본 예제 함수를 선언하고 생성하지 않아도 간단히 쓸 수 있습니다 lambda_x = lambda x: x ** 3 print(lambda_x(2)) 출력 8 lambda_x라는 변수를 만들어서 값을 집어넣습니다. 함수의 인자에 '2'를 집어넣으면 x ** 3의 x에 2가 들어갑니다. 그리곤 값을 반환해줍니다. 원래 함수형을 생각해보자면 def lambda(x): return x ** 3 이런 식의 형태로 짤 수 있습니다 x라는 인자를 입력받아서 y라는 출력을 반환합니다. 하지만 lambda 함수는 간결화시켰다고 생각하시면 될 거 같습니다 인자를 여러 개 받을 수도 있습니다 lambda_xy = la.. 2021. 7. 7. numpy 기본편-2 ( sort(), dot(), .T, transpose(), [::-1], 연산자, random, rand(), randint()) 안녕하세요 어제 numpy 기본편-1 에 이어 numpy 기본편-2 를 시작하겠습니다 원하는 값만 출력 저희가 원하는 조건에 해당하는 애들만 출력하고 싶다면 자연스레 연산자가 떠오릅니다. 그럼 0부터 9까지 있는 숫자 중에 4보다 큰 애들만 출력해보겠습니다 array6 = np.arange(start=0, stop=10) array10 = array6[array6 > 4] array11 = array6 > 4 print(f"array6[array6>4]={array10}") print(f"array6>4={array11}\n") 출력 array6[array6>4]=[5 6 7 8 9] array6>4=[False False False False False True True True True True] 4.. 2021. 6. 24. 이전 1 ··· 12 13 14 15 16 17 18 19 다음