Series 데이터 심플 분석(개수, 빈도 등 계산하기)

학습목표

import numpy as np
import pandas as pd

s = pd.Series([1, 1, 2, 1, 2, 2, 2, 1, 1, 3, 3, 4, 5, 5, 7, np.NaN])
s

   1.0
   1.0
   2.0
   1.0
   2.0
   2.0
   2.0
   1.0
   1.0
   3.0
  3.0
  4.0
  5.0
  5.0
  7.0
  NaN
dtype: float64

len(s)

s.size

s.shape #1차원 이다.

(16,)

s.unique() #중복된 값 제거!

array([ 1.,  2.,  3.,  4.,  5.,  7., nan])

s.count() #NaN를 뺀 count 값 

a = np.array([2, 2, 2, 2, np.NaN])
a.mean()

b = pd.Series(a)
b.mean()

2.0

s.mean()

2.6666666666666665

   1.0
   1.0
   2.0
   1.0
   2.0
   2.0
   2.0
   1.0
   1.0
   3.0
  3.0
  4.0
  5.0
  5.0
  7.0
  NaN
dtype: float64

s.value_counts()

0    5
0    4
0    2
0    2
0    1
0    1
dtype: int64

index를 활용하여 멀티플한 값에 접근

s[[5, 7, 8, 10]].value_counts()

0    2
0    1
0    1
dtype: int64

s.head(n=7)

  1.0
  1.0
  2.0
  1.0
  2.0
  2.0
  2.0
dtype: float64

s.tail()

  4.0
  5.0
  5.0
  7.0
  NaN
dtype: float64

   1.0
   1.0
   2.0
   1.0
   2.0
   2.0
   2.0
   1.0
   1.0
   3.0
  3.0
  4.0
  5.0
  5.0
  7.0
  NaN
dtype: float64