<회귀> Scalar

Scalar

- 데이터를 어떻게 스케일링하는게 적절한지 항상 고려해야 한다

- 스케일링에 따라 성능차이가 날 수 있다

- 데이터셋

x_train.describe()

StandardScalar

- 평균(mean)을 0, 표준편차(std)를 1로 만든다

from sklearn.preprocessing import StandardScaler

std_scaler = StandardScaler()
std_scaled = std_scaler.fit_transform(x_train)
round(pd.DataFrame(std_scaled).describe(), 2)

MinMaxScalar

- min값과 max값을 0~1사이로 정규화한다

from sklearn.preprocessing import MinMaxScaler

minmax_scaler = MinMaxScaler()
minmax_scaled = minmax_scaler.fit_transform(x_train)
round(pd.DataFrame(minmax_scaled).describe(), 2)

StandardScalar

- 중앙값(median)을 0으로, IQR(interquartile range)을 1로 변환한다

- outlier 처리에 유용하다

from sklearn.preprocessing import RobustScaler

robust_scaler = RobustScaler()
robust_scaled = robust_scaler.fit_transform(x_train)
round(pd.DataFrame(robust_scaled).median(), 2)

저작자표시

Scalar
StandardScalar
MinMaxScalar
StandardScalar

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

<회귀> Scalar

Scalar

StandardScalar

MinMaxScalar

StandardScalar

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역