본문 바로가기
반응형

개발 Tools/파이썬_Pandas & Numpy21

파이썬 Pandas value_counts (고윳값) value_counts 열의 고윳값 별 몇 개 있는지 알려준다. 중복을 피해서 볼 때 좋다. 열 "C0"에 대해 값을 봤다. import pandas as pd df = pd.DataFrame([[0, 1, 2], [3, 4, 5]], index=["r0", "r1"], columns=["c0", "c1", "c2"]) print(df) 출력 c0 c1 c2 r0 0 1 2 r1 3 4 5 print(df["c0"].value_counts()) 출력 0 1 3 1 Name: c0, dtype: int64 2021. 10. 17.
pandas 행열 이름 바꾸기 (rename) 우린 행과 열의 이름을 바꾸고 싶을 때가 있다. 이때 pandas에서 아주 간단하게 바꿀 수 있다. 데이터 프레임 생성 먼저 임의로 데이터 프레임을 만들어 보겠습니다. import pandas as pd index = [2019, 2020, 2021] columns = {"계절": ["여름", "여름", "가을"], "온도": [36, 37, 40]} df = pd.DataFrame(columns, index=index) print(df) 출력 계절 온도 2019 여름 36 2020 여름 37 2021 가을 40 열을 딕셔너리로 주어집니다. 행 이름 변경 행을 우린 index라고 칭합니다. 우린 행 이름을 변경할 건데. "이름을 바꾸다 = rename"입니다. 행을 2019에서 "2019년"으로 2020.. 2021. 7. 27.
numpy 기본편-2 ( sort(), dot(), .T, transpose(), [::-1], 연산자, random, rand(), randint()) 안녕하세요 어제 numpy 기본편-1 에 이어 numpy 기본편-2 를 시작하겠습니다 원하는 값만 출력 저희가 원하는 조건에 해당하는 애들만 출력하고 싶다면 자연스레 연산자가 떠오릅니다. 그럼 0부터 9까지 있는 숫자 중에 4보다 큰 애들만 출력해보겠습니다 array6 = np.arange(start=0, stop=10) array10 = array6[array6 > 4] array11 = array6 > 4 print(f"array6[array6>4]={array10}") print(f"array6>4={array11}\n") 출력 array6[array6>4]=[5 6 7 8 9] array6>4=[False False False False False True True True True True] 4.. 2021. 6. 24.
numpy 기본편-1 ( array(), dtype, shape, astype(), arange(), zeros(), ones() , reshape(),reshape(-1,1) ) 안녕하세요 이번에는 numpy의 모든 것에 대해 정리해보겠습니다 내용이 조금 있는 관계로 1편 2편으로 나눌 예정입니다 어느 정도만 알고 있으면 따로 공부할 필요가 없고 실제로 사용하면서 실력을 성장시키면 될 거 같습니다. 시작해보겠습니다 import numpy 먼저 import 를 사용하여 불러옵니다 "np" 라는 이름으로 numpy 를 불러옵니다 import numpy as np 차원 numpy 에는 1차원 2차원(2D) 3차원(3D) 이 존재합니다 1차원 1차원을 먼저 출력해 보겠습니다 array1 = np.array([1, 2, 3]) print(type(array1)) print(array1.shape) print(array1, "\n") 출력 (3,) [1 2 3] 마지막에 "\n" 역슬래시 .. 2021. 6. 23.
pandas 그룹으로 나누기 ( groupby(), agg() ) 안녕하세요! 이번에는 간단히 groupby 라는 함수를 알아볼까 합니다. pivot_ table 과 같은 기능을 하는데요 저는 groupby 만 쓰려합니다! groupby 란, 원래 데이터 프레임에서 내가 원하는 데이터 프레임을 만다는 걸 의미합니다. 영어 뜻부터 그룹화 한다, [by ==~로] 입니다! 사용법은 간단합니다. df.groupby(["~를"])["~로"].계산 뒤에 count() 는 내가 원하는 값에 따라 다르게 설정할 수 있습니다 ( sum, mean 등등 ). 원래 데이터 프레임에서 "성별코드" 에 따라 "가입자일련번호" 를 카운트 해라! 입니다. 당연히 그럼 궁금증이 생깁니다. 만약 내가 1:1 대응이 아니라 여러 개라면?? 이것 또한 간단합니다. [] 안에 추가만 해주면 됩니다 이러.. 2021. 4. 29.