Leeway의 블로그

  • 홈
  • 태그

pandas 1

[pandas] query, isin, Boolean_masking 비교

방향 이 글은 데이터 분석에서 일상적으로 사용하는 filter 함수인 query, boolean masking, isin의 성능 비교 및 상황에 맞는 사용 방법에 대해 설명합니다. DataFrame.query() query 매서드는 유용성 대비 사람들이 많이 사용하지 않는 기능인 것 같습니다. 보통 100,000개 이상 row를 다룰 때 성능이 좋다고 알려져있는데, 사실 성능보다는 어떤 조건으로 필터링을 했는지 직관적으로 알 수 있고, 코드를 간결하게 쓸 수 있는 점에서 유용하게 쓰일 수 있습니다. 장점 필터링을 단순하게 표현할 수 있습니다. import pandas as pd import numpy as np # row 100만개, column 3개 df 생성 df = pd.DataFrame(10+60..

데이터분석/분석툴 2022.09.06
이전
1
다음
더보기
프로필사진

  • 분류 전체보기 (2)
    • 데이터분석 (1)
      • 분석툴 (1)
    • 딥러닝&머신러닝 (1)
      • NLP 이론 (0)
      • 머신러닝 이론 (1)

Tag

boolean, confusion matrix, FPR, recall, query, roc, tool, Mask, Machine Learning, roc curve, Precision, isin, tpr, performance, boolean masking, pandas, precision-recall curve,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바