본문 바로가기
728x90
반응형

2023-2/데이터 분석과 머신러닝3

기계 학습 기계학습 개념 선형 회귀: 데이터를 잘 표현하는 직선 한개를 찾아, 새로운 상황에 대한 예측을 가능하게 함 로지스틱 회귀: 배경지식을 토대로 분류 작업을 할 수 있음 선형 회귀(Linear Regression) 주어진 학습 데이터의 추이에 대해 가장 적합한 직선 방정식을 추론해내는 것 학습 데이터의 예 : 공부시간에 대한 시험성적 공부시간(x) 시험성적(t) 9 74 14 81 21 86 27 90 32 88 37 92 위 데이터를 보면 공부시간에 비례해서 시험성적도 증가하는 경향을 보임. 점들의 추이를 가장 잘 나타내는 직선(y=Wx+b)을 찾아서, 주어지지 않은 공부시간에 대한 시험 성적을 예상할 수 있음. 선형회귀는 주어진 학습 데이터의 추이에 대해 가장 적합한 직선 방정식을 추론해내는것. => 주.. 2023. 10. 21.
Python summary 파이썬 기초 변수: 자료형을 명시할 필요 없음 a = 4 부동소수점 실수 123e2 #12300.0 123.456e-3 #0.123456 유효숫자e지수 형태로 적으면 된다. 출력 형식(format) 기본 방법 # 숫자를 문자열에 삽입하기 number = 42 formatted_string = "숫자는 {}입니다.".format(number) print(formatted_string) # 출력: 숫자는 42입니다. # 여러 개의 값을 삽입하기 name = "홍길동" age = 30 formatted_string = "이름은 {}, 나이는 {}세 입니다.".format(name, age) print(formatted_string) # 출력: 이름은 홍길동, 나이는 30세 입니다. .format(변수값)을 입.. 2023. 10. 18.
머신러닝 개요 Data Science 4차 산업 시대: 빅데이터, 인공지능 데이터 과학: 다양한 데이터로부터 지식과 인사이트를 추출하는 과학적 방법론. 프로세스,알고리즘,시스템을 통합하는 융합분야. -데이터 마이닝, 빅데이터 머신러닝: 기계에게 데이터를 학습시켜 규칙성을 찾아내 미래를 에측하거나 분류,인식하는 기술 - 인공지능, 딥러닝 빅데이터의 특징 3V 규모(Volume) 속도(Velocity) 다양성(Variety) +5V 신뢰성(Veracity) 가치(Value) 데이터 분석 방법(론) 기술 통계: 수집,축적한 데이터를 묘사,설명하는 통계 기법. 대표값 분석 - 평균,중앙값,최빈값/ 분산 분석 - 표준편차, 분산, 사분위값 추론 통계: 수집,축적한 데이터를 기반으로 일반적인 상황을 추론,예측하는 통계기법. - .. 2023. 10. 18.
728x90
반응형