Series 데이터 Boolean Selection으로 데이터 선택하기

학습목표

  1. Series boolean selection 활용하기
import numpy as np
import pandas as pd

Boolean selection

  • boolean Series가 []와 함께 사용되면 True 값에 해당하는 값만 새로 반환되는 Series객체에 포함됨
  • 다중조건의 경우, &(and), (or)를 사용하여 연결 가능
s = pd.Series(np.arange(10), np.arange(10)+1) # ( 값,주소 )
s
1     0
2     1
3     2
4     3
5     4
6     5
7     6
8     7
9     8
10    9
dtype: int32
s > 5
1     False
2     False
3     False
4     False
5     False
6     False
7      True
8      True
9      True
10     True
dtype: bool
s[s>5]
7     6
8     7
9     8
10    9
dtype: int32
s[s % 2 == 0]
1    0
3    2
5    4
7    6
9    8
dtype: int32
s
1     0
2     1
3     2
4     3
5     4
6     5
7     6
8     7
9     8
10    9
dtype: int32
s.index > 5
array([False, False, False, False, False,  True,  True,  True,  True,
        True])
s[s.index > 5]
6     5
7     6
8     7
9     8
10    9
dtype: int32
(s > 5) & (s < 8)
1     False
2     False
3     False
4     False
5     False
6     False
7      True
8      True
9     False
10    False
dtype: bool
s[(s > 5) & (s < 8)]
7    6
8    7
dtype: int32
(s >= 7).sum()
3
(s[s>=7]).sum() # 7+8+9 = 24
24