본문 바로가기
반응형

개발 Tools92

Seaborn barplot 그리기 ( 신뢰도, 표준편차, hue) 안녕하세요 이번에는 막대그래프를 그려보겠습니다 바로 코드부터 보겠습니다 데이터 x축 y축 이렇게 세가지는 꼭 필요합니다 그림을 보겠습니다 여기서 저 검은 막대는 뭔가 궁금하실텐데요 저 막대는 신뢰도(ci) 를 나타내는 막대입니다. 기본적으로 95% 의 신뢰도를 가지고 있습니다 근데 만약 저 검은 막대가 필요없다면 ci=False 를 하시면 됩니다 그럼 이런 그림이 나옵니다 다음으로는 hue 값을 지정해서 보겠습니다 음주여부에 따라 다르게 표시했습니다 바로 그림을 보겠습니다 근데 만약 신뢰구간이 아니라 다른 값으로 하고 싶다면 어떻게 할까요? ci ="sd" (표준편차) 로 변경해주면 됩니다 여기선 표준편차를 기준으로 변경해 보겠습니다 달라진게 보이시나요? 감사합니다 2021. 5. 12.
Seaborn countplot 그리기 안녕하세요 이번에는 수를 세어주는 countplot 을 공부해보겠습니다 다른 그래프들과 다른 점이라면 수를 세어주니 x, y 축 중 하나만 필요하다는 점이 있겠습니다. 코드와 그림을 보겠습니다. (1000개의 샘플을 뽑아 사용했습니다) fig2, ax2 = plt.subplots() sns.countplot(ax=ax2, x="음주여부", data=df_sample) 간단합니다 이전에 사용했던 hue 값을 사용하여 보도록 하겠습니다 fig1, ax1 = plt.subplots() sns.countplot(ax=ax1, x="음주여부", data=df_sample, hue="성별코드") 이처럼 성별코드에 따라 다르게 count 했습니다 위에서 x, y 중 하나만 있으면 된다고 했는데 이번엔 y 축으로 기준.. 2021. 5. 12.
Seaborn Scatterplot 그리기 ( ax, style, size, hue ) 안녕하세요! 이번에는 시각화의 대표적인 seabron 으로 scatterplot 을 그려보겠습니다. matplotlib 에도 있지만 seaborn은 조금 더 고급스러운 느낌을 주는데요. 차근차근 알아보도록 하겠습니다. 먼저, 사용법 코드를 보겠습니다 각각의 그림을 그리기 위해 fig, ax 를 했습니다 먼저 ax 를 지정해줍니다. 그리고 어떤 data 를 쓸지 정합니다. x 축에는 어떤 컬럼의 값이 들어갈지 정합니다. y 축에는 어떤 컬럼의 값이 들어갈지 정합니다. grid() 는 격자점을 의미하는데요. 이번에만 사용하요 다음 그림에는 사용하지 않겠습니다 그림은 어떻게 될까요? 샘플은 100개만 사용했습니다 이제 여기서 저희는 남자/여자에 대한 신장과 체중을 알아보려 합니다. 이땐 hue 라는 조건을 사.. 2021. 5. 10.
지역별 전기 사용량 군집화 (덴드로그램, KMeans, 클러스트링, pandas code pretty) 안녕하세요 이번엔 지역별 전기 사용량을 가지고 군집화를 해보도록 하겠습니다. 먼저 초기에 불러올 것들이 좀 있습니.다한번 불러와 보겠습니다 import AI 를 하기 위해서 기본적인 라이브러리를 불러와야 합니다. 대표적으로 Sklearn 과 scipy 가 있습니다. pd.set_option 은 출력을 했을 때 예쁘게 나오게 하기 위한 코드입니다 .꼭 없어도 됩니다! 원하는 데이터 추출 파일에서 제가 필요한 컬럼인 "서비스업" 과 "제조업" 에 해당하는 전기사용량만 가져와 보겠습니다 먼저 "구분" 으로 행을 지정합니다. 원래는 0,1,2 이렇게 지정돼 있었습니다. 그리고 개성과 합계는 분석하는데 필요가 없으니 제거합니다 inplace=True 는 원본을 바꿔치기하겠단 말입니다 그려보기 한번 그려서 출력해보.. 2021. 5. 1.
pandas 그룹으로 나누기 ( groupby(), agg() ) 안녕하세요! 이번에는 간단히 groupby 라는 함수를 알아볼까 합니다. pivot_ table 과 같은 기능을 하는데요 저는 groupby 만 쓰려합니다! groupby 란, 원래 데이터 프레임에서 내가 원하는 데이터 프레임을 만다는 걸 의미합니다. 영어 뜻부터 그룹화 한다, [by ==~로] 입니다! 사용법은 간단합니다. df.groupby(["~를"])["~로"].계산 뒤에 count() 는 내가 원하는 값에 따라 다르게 설정할 수 있습니다 ( sum, mean 등등 ). 원래 데이터 프레임에서 "성별코드" 에 따라 "가입자일련번호" 를 카운트 해라! 입니다. 당연히 그럼 궁금증이 생깁니다. 만약 내가 1:1 대응이 아니라 여러 개라면?? 이것 또한 간단합니다. [] 안에 추가만 해주면 됩니다 이러.. 2021. 4. 29.