반응형

파이썬 4

Scikit-learn RandomForest 사용법

RandomForest 개념 정의 랜덤포레스트(RandomForest)란 머신러닝에서 널리 사용하는 앙상블(Ensemble) 방법 중 하나로 여러 개의 트리를 조합하여 예측하는 모델이다. 랜덤포레스트는 부트스트래핑(Bootstrapping)과 배깅(Bagging)을 기반으로한다. 부트스트래핑(Bootstrapping)이란 현재 보유하고 있는 데이터 셋으로 다른 데이터 셋틀 만드는 방법이다. 배깅이란 Bootstrap aggregating으로 여러개의 모델을 독립적으로 학습한 후 그 결과를 투표한 결과를 종합하는 방법이다. Scikit-learn RandomForest import from sklearn.datasets import load_iris from sklearn.model_selection im..

python에서 image data를 zarr array로 저장하는 방법

zarr 란? zarr란 데이터를 chunk 단위의 배열로 저장할 수 있는 파이썬 라이브러리다. 데이터를 chunk로 나누어 저장하는 이유는 많은 데이터를 병령처리하여 불러오기 위함이다. Zarr is a format for the storage of chunked, compressed, N-dimensional arrays inspired by HDF5, h5py and bcolz. 영어로 format 이라 부르는데, 한국어로 형식 정도로 번역할 수 있다. DataSet https://www.kaggle.com/datasets/pranavraikokte/covid19-image-dataset Covid-19 Image Dataset 3 Way Classification - COVID-19, Viral ..

파이썬/zarr 2023.08.16

Pandas Series와 DataFrame 생성하기

Pandas Series와 DataFrame 생성하는 기본적인 코드를 알아봅니다. Pandas Series 만들기 import pandas as pd # 리스트를 활용하여 Series 생성 data = [10, 20, 30, 40, 50] series = pd.Series(data) print(series) Pandas Series 결과 Pandas DataFrame 만들기1 import pandas as pd # 딕셔너리를 활용하여 DataFrame 생성 data = { 'Name': ['A', 'B', 'C', 'D', 'E'], 'Age': [25, 30, 35, 40, 45], 'Score': [90, 85, 70, 95, 80] } df = pd.DataFrame(data) df Pandas D..

파이썬/pandas 2023.07.31
반응형