Archive: 2022

ML Practice 2_2

Prepare data with Numpy12345678fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5,

ML Practice 2_1

ML AlgorithmSupervised Learning(지도 학습) Input(입력; independent variable) & Target(타깃; dependent variable) Question with a correct answer Type 1: Classification(분류) Type 2: Regression(예측) Feature(특

ML Practice 1_3

Market and Machine LearningClassify Bream and SmeltBream Data123456bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0,

Visualization tutorial

데이터 시각화의 기본 조건 목적에 맞는 그래프 선정 선형 그래프, 막대 그래프, 산점도, 박스플롯 등등 환경에 맞는 도구 선택 코드 기반 : R, Python 프로그램 기반 : Excel, PowerBI, Tableau 등등 문맥(도메인)에 맞는 색과 도형 사용 파이썬 시각화 라이브러리Matplotlib 정형 데이터 / 이미지 데이터 P

10minutes to Pandas

Import Library1234import numpy as npprint("numpy ver." + np.__version__)import pandas as pdprint("pandas ver." + pd.__version__) numpy ver.1.21.5 pandas ver.1.3.5 Object Creation

Pandas tutorial 2

라이브러리 불러오기1234import numpy as npprint("numpy: ver.", np.__version__)import pandas as pdprint("pandas: ver.", pd.__version__) numpy: ver. 1.21.5 pandas: ver. 1.3.5 데이터 불러오기12from

Pandas tutorial 1

데이터 전처리 프로세스 중복값 제거 및 결측치 처리 완전 무작위(MCAR) / 무작위(MAR) / 비무작위(NMAR) 제거, 치환, 모델 기반 처리 등 이상치 탐지 및 처리 삭제, 대체, 변환(스케일링) 등 Feature Engineering 정규화, 표준화, 로그변환, 벡터화 등 PCA, EFA 등을 통한 차원 축소 Pand

Numpy tutorial

파이썬 라이브러리 설치in R (코드에서 실행) install.package(“패키지명”) library(패키지명) in Python (터미널에서 실행) 방법1. conda 설치 (주 사용목적: 데이터 과학) 아나콘다 설치 후에 conda 설치 가능 방법2. pip 설치 (개발, 데이터 과학, 그 외) 아나콘다 없이도 python만 설치하면 됨

Python Basic 4

클래스(Class) 목적 : 코드의 간결화, 코드의 재사용, 유지보수 용이 여러 클래스가 모여서 하나의 라이브러리가 됨 장고 / 웹개발 / 머신러닝 / 시각화 / 전처리 클래스명은 대문자로 시작해야 함 1234567891011121314151617class Person: # class attribute (선택)

Python Basic 3

기초 문법 리뷰리스트, 튜플, 딕셔너리1234567891011121314# 리스트book_list = ['A', 'B', 'C']print(book_list)# append, extend, insert, remove, pop, etc# 튜플book_tuple = ('A', 'B