본문 바로가기

TIL _Today I Learned110

[DAY 8] Data Manipulation, Data Preprocessing [천재교육] 프로젝트 기반 빅데이터 서비스 개발자 양성 과정 9기학습일 : 2024.07.22📕 학습 목록데이터 체크리스트데이터 전처리 📗 기억할 내용1. 데이터 전처리 전 체크리스트데이터 형식 확인: 데이터 파일 형식 (CSV, Excel, JSON 등)과 데이터셋 구조(행, 열)를 확인데이터 유형 확인: 각 열의 데이터 유형(숫자형, 문자열형, 날짜형 등)을 확인하여 필요시 변환할 수 있도록 준비결측치 확인: 각 열의 결측치 개수와 분포를 확인하여 결측치 처리 전략을 세움이상치 확인: 이상치가 있는지 확인하고 데이터의 통계적 분포를 파악하여 처리 방법을 결정중복 데이터 확인: 중복된 행이 있는지 확인하여 불필요한 중복 데이터를 제거할지 여부를 결정데이터 정규화/스케일링 필요성 확인: 데이터 분석이.. 2024. 7. 22.
[DAY 7] Data Manipulation [천재교육] 프로젝트 기반 빅데이터 서비스 개발자 양성 과정 9기학습일 : 2024.07.19📕 학습 목록데이터 분석 시작하기데이터 불러오기데이터 확인하기범주형 자료수치형 자료데이터 선택하기데이터 조작하기 📗 기억할 내용 1) 데이터 분석 시작하기 ① Numpy 란?파이썬의 고성능 수치 계산 라이브러리ndarray : Numpy 배열Numpy 배열 생성 방법import numpy as np# 1차원 배열 생성array_1d = np.array([1, 2, 3, 4, 5])# 배열에 문자열이 있으면 모든 값을 문자열로 변환# Numpy가 하나의 자료형만 허용하기 때문array_1d_str = np.array([1, 2, 3, 4, "5"])# 2차원 배열 생성array_2d = np.array([[1,.. 2024. 7. 19.
[DAY 6] Python Crawling [천재교육] 프로젝트 기반 빅데이터 서비스 개발자 양성 과정 9기학습일 : 2024.07.18📕 학습 목록파이썬이란?마크다운 문법기본 자료형변수사용자 입력/출력연산자 📗 기억할 내용 1) 명시적 형 변환 : 특정 타입의 자료를 다른 타입의 자료로 변환하는 것int() : 문자열/실수형 → 정수형float() : 문자열/정수형 → 실수형str() : 실수형/정수형/불린형 → 문자열bool() : 실수형/정수형/문자열 → 불린형2) 변수식별자(Identifiers) : 변수의 이름. 할당 연산자(=)의 왼쪽 부분리터럴(Literal) : 데이터의 값. 할당 연산자(=)의 오른쪽 부분재할당이 가능동시 할당이 가능 : x, y = 10, 203) 사용자 입력/출력내장함수 input()을 통해 받는 모든 값은.. 2024. 7. 18.
[DAY 5] Python Crawling [천재교육] 프로젝트 기반 빅데이터 서비스 개발자 양성 과정 9기학습일 : 2024.07.17📕 학습 목록HTML 구조요청과 응답HTML 파싱웹 브라우저 자동화 도구웹 페이지 상호작용 📗 기억할 내용 1) HTML 구조class : 모든 요소에 적용되는 속성id : 고유 식별자를 지정. 각 요소마다 고유한 id를 가짐과 : 사용자에게 정보를 입력 받고, 해당 정보를 서버로 제출2) 요청과 응답HTTP 프로토콜 : 사용자 - 웹 서버가 서로 대화하기 위한 약속HTTP 상태 코드 - 200 : 요청을 성공적으로 처리- 400 : 잘못된 요청- 404 : 요청한 결과물을 찾을 수 없음- 500 : 서버 오류 발생HTML 문서 출력# HTTP 요청에 대한 응답의 본문을 반환import requestsres.. 2024. 7. 17.
[DAY 4] Python Programming [천재교육] 프로젝트 기반 빅데이터 서비스 개발자 양성 과정 9기학습일 : 2024.07.16📕 학습 목록이차원 리스트객체지향 프로그래밍 📗 기억할 내용 1) 다중 for문for a in range(4): print(f"a가 {a}일 때") for b in range(4): print(f"b는 {b}")a가 0일 때b는 0b는 1b는 2b는 3a가 1일 때b는 0b는 1b는 2b는 3a가 2일 때b는 0b는 1b는 2b는 3a가 3일 때b는 0b는 1b는 2b는 3 2) 이차원 리스트1차원 직선 형태의 리스트를 벗어난 2차원 평면 형태의 리스트리스트를 원소로 가지는 리스트행렬(Matrix)이라고도 하며, 세로(행, column, y)와 가로(열, index, x) 길이를 가짐m.. 2024. 7. 16.
[DAY 3] Python Programming [천재교육] 프로젝트 기반 빅데이터 서비스 개발자 양성 과정 9기학습일 : 2024.07.15📕 학습 목록반복문함수파일 입력/출력모듈예외처리 📗 기억할 내용1) 반복문수많은 원소에 효율적으로 접근하기 위함① for 반복문반복 횟수가 정해져 있는 경우; 컨테이너에 담긴 원소의 갯수 만큼 반복반복 가능한 자료형 : 컨테이너 자료형(리스트, 문자열, 레인지, 튜플, 딕셔너리, 셋)for i in range(10, 0, -1) → i 출력시, 10 9 8 7 6 5 4 3 2 1 ② whlie 반복문조건에 대한 평가(참/거짓)에 따라 반복 여부 결정무한 반복 가능 : 조건이 항상 참인 경우 조건문 대신 while True: 의 형태로도 작성 가능③ 반복 제어문break : 반복문 강제 종료 키워드. brea.. 2024. 7. 15.