DataFrame 원하는 column(컬럼)만 선택하기

학습목표

기본적으로 [ ]는 column을 추출
컬럼 인덱스일 경우 인덱스의 리스트 사용 가능
- 리스트를 전달할 경우 결과는 Dataframe
- 하나의 컬럼명을 전달할 경우 결과는 Series

import pandas as pd

# data 출처: https://www.kaggle.com/hesh97/titanicdataset-traincsv/data
train_data = pd.read_csv('./train.csv')
train_data.head()

	PassengerId	Survived	Pclass	Name	Sex	Age	SibSp	Ticket	Fare	Cabin	Embarked
0	1	0	3	Braund, Mr. Owen Harris	male	22.0	1	A/5 21171	7.2500	NaN	S
1	2	1	1	Cumings, Mrs. John Bradley (Florence Briggs Th...	female	38.0	1	PC 17599	71.2833	C85	C
2	3	1	3	Heikkinen, Miss. Laina	female	26.0	0	STON/O2. 3101282	7.9250	NaN	S
3	4	1	1	Futrelle, Mrs. Jacques Heath (Lily May Peel)	female	35.0	1	113803	53.1000	C123	S
4	5	0	3	Allen, Mr. William Henry	male	35.0	0	373450	8.0500	NaN	S

train_data['Survived'] #컬럼명 꼭 써주자!

    0
    1
    1
    1
    0
      ..
  0
  1
  0
  1
  0
Name: Survived, Length: 891, dtype: int64

train_data[['Survived', 'Name', 'Age', 'Embarked']]

	Survived	Name	Age	Embarked
0	0	Braund, Mr. Owen Harris	22.0	S
1	1	Cumings, Mrs. John Bradley (Florence Briggs Th...	38.0	C
2	1	Heikkinen, Miss. Laina	26.0	S
3	1	Futrelle, Mrs. Jacques Heath (Lily May Peel)	35.0	S
4	0	Allen, Mr. William Henry	35.0	S
...	...	...	...	...
886	0	Montvila, Rev. Juozas	27.0	S
887	1	Graham, Miss. Margaret Edith	19.0	S
888	0	Johnston, Miss. Catherine Helen "Carrie"	NaN	S
889	1	Behr, Mr. Karl Howell	26.0	C
890	0	Dooley, Mr. Patrick	32.0	Q

891 rows × 4 columns