인공지능
: 기계가 지능을 갖도록 하는 것. '지능'은 주변 환경에서 기계가 적절하고 예측가능한 방식으로 동작하는 것.
문제는 '지능'이라는 개념이 매우 모호함.
AI의 역사.
-1956년 다트머스대학 워크샵에서 "사람처럼 생각하는 기계"라는 개념의 AI라는 용어 등장.
이후 다양한 AI기술이 개발되어왔음.
2000년대에 딥러닝등이 개발된듯..
인공지능과 머신러닝,딥러닝의 관계
인공지능과 머신러닝,딥러닝은 기술범주에 있어 포함관계이다.
머신러닝: 특징 데이터를 입력 받아, 자동으로 분류 등과 작업을 수행할 수 있는 프로그램(알고리즘)을 자동으로 만들어 내는 기술
딥러닝: 특징 추출부터 추론/예측까지 전 주기의 자동화를 실현한 머신러닝의 한 분야. 최근 인공지능 붐을 가져오는데 실질적인 기여를 함.
머신러닝의 정의: 컴퓨터가 경험적 데이터를 학습해서 지능적으로 동작(예측: 판단, 분류, 추론)할 수 있는 기능을 갖추게 하는 인공지능의 세부 분야. 확률통계가 중요함.
전통적 프로그래밍은 Data를 프로그램에 넣어 Output을 받는데,
머신러닝은 Data와 Output을 머신러닝을 통해 프로그램을 만들어내는것으로 묘사됨..
(보통 고양이 사진을 프로그램에 넣으면 "고양이" 라는 답을 내는데,
고양이 사진과 "고양이"라는 답을 머신러닝을 통해 모델을 생성한다는 말인듯)
머신러닝 학습 방식
-감독 학습(Supervised Learning, 지도학습)
데이터와 라벨을 더한 학습데이터를 구축하고,
학습데이터를 통해 입력에 대한 출력의 관계를 매핑한 예측모델을 생성, 활용함.
주요 태스크: 분류, 회귀.
응용 사례: 사물 인식, 손글씨 인식, 음성 인식, 의료 진단, 웹 광고 클릭 확률
-비감독 학습(Unsupervised learning)
라벨 없이 단순히 데이터만으로 학습함.
데이터에 나타나는 통상적인 유사, 공통 현상을 학습함.
향후 학습의 완결성을 위해 보다 많이 연구되어야 할 분야.(인간의 학습의 원형으로 간주되고있음)
주요 태스크: 클러스터링(유사도 기반), 밀도 예측
응용 사례: 고객 분류(고객정보 안에 남성,여성 등으로 나눠져있어서 라벨링하지 않아도 분류가 쉬움), 이미지 압축, 생물정보학
-강화학습(Reinforcement learning)
최근 각광받고 있는 기술임.
알파고가 강화학습을 통해 만들어졌음.
머신러닝 기법의 구성 체계
머신러닝 기법은 학습데이터, 모델, 학습 알고리즘의 3가지 요소로 구성됨.
학습데이터를 학습 알고리즘을 돌려 모델을 얻음.
학습데이터
학습을 위햏 특별히 수집,정리한 학습샘플 집합.
학습샘플은 샘플(데이터)과 목표치(Label) 쌍임.
-샘플은 특징의 집합
-목표치(Label)은 샘플에 대한 추론(예측) 정답. (단, 비지도학습에는 없음)
머신러닝 모델
모델로 예측을 수행할 때, 그 결정경계의 모양 측면에서 선형과 비선형 모델로 구분 가능.
선형모델=> 선을 기준으로 위는 + 아래는 - 이런식..
비선형 모델=> 현실세계의 대부분의 것들은 비선형모델임..
머신러닝의 시나리오 사례
심장병 판별 머신러닝 시스템
1. 진료 데이터(샘플) 수집. (이 때, 정답이 되는 의사 소견서도 함께 수집함)
2. 자료 전처리 및 학습데이터 구축.(특징 정의 및 심볼화/수치화 등)
3. 모델 학습
4. 활용단계: 환자의 정보를 이용하여 심장병이 있는지 판별할 수 있게 됨
딥러닝의 부상 이유
딥러닝은 새로운 기술이 아님.
시대적 환경(컴퓨팅 환경+ 풍부한 학습데이터+ 딥러닝 알고리즘)의 산물
딥러닝 특징
-다층구조
-계층적 추상화 학습
-End to End 학습(전문가 개입 없이 특징을 자동추출함)
머신러닝의 성능은 지속적으로 향상되고있음
댓글