최근 수정 시각 : 2024-07-14 22:52:07

AutoML

1. 개요2. 배경 및 역사
2.1. 배경
2.1.1. 필요성
2.2. 역사
3. AutoML 방법
3.1. 하이퍼파라미터 최적화
3.1.1. 블랙박스 하이퍼파라미터 최적화3.1.2. 다중 충실도 최적화
3.2. 메타러닝
4. AutoML 시스템
4.1. 오토웨카4.2. 하이퍼옵트 사이킷런4.3. 오토사이킷런4.4. 딥신경망의 자동 튜닝
4.4.1. 오토넷 1.04.4.2. 오토넷 2.0
4.5. 자동 통계 전문가 시스템
4.5.1. 시계열 데이터에 대한 자동 통계 전문가 시스템
5. 현황 및 시 동향
5.1. 현황
5.1.1. 사물인터넷(IoT) 기기의 급증5.1.2. 자동 머신러닝(AutoML)의 성능이 향상
5.2. 시장 동향
6. 향후 개발 전망
6.1. 향후 개발 전망
6.1.1. 실력이 향상6.1.2. 분야 확장6.1.3. 개인화된 맞춤화6.1.4. 모델 해석 가능성

1. 개요

AutoML은 Automated Machine Learning의 약자이며, 기계 학습을 실생활의 문제 해결에 적용하는 과정 중 일부를 자동화하는 것을 말한다. 여기서의 자동화란 사람의 손을 거치지 않고 기계가 알아서 처리하게 되는 것을 의미한다.
파일:automl.png

2. 배경 및 역사

2.1. 배경

AutoML은 최근 몇 년 동안 산업 및 학계의 인공 지능 연구에서 트렌디한 주제이다. 2016년, 구글 딥마인드의 알파고나 2020년 GPT-3라는 인공지능 언어 모델 등 강력한 성능을 보인 인공지능이 많이 등장하고 있지만 왜 바로 상용화로 이어지지 않을까?

딥러닝에서 사물 인식 정확도를 높이려면 빅데이터 수준의 많은 자료를 이용한 학습이 필요하다. 하지만 빅데이터를 사용하게 되면 자금과 시간 등 투자 비용이 상승하기에 효과적이지 않다. 또한, 새로운 문제를 맞닥뜨릴 때마다 해당 지식을 활용하는 일도 요구되는데, 이것은 가능한 수준의 인력과 예산을 확보하여 실무에 적용할 수 있는 인공지능 알고리즘은 특정 집단에 제한적으로 가능하며, 전문가 수에 비하여 인공지능 문제는 다양하고 급속하게 증가하고 있어 막대한 투자가 가능하더라도 근본적인 해결책이 될 수 없다. 그렇다면 이러한 문제는 어떻게 개선해야 할까?

일반적인 머신러닝 개발에서 상용화에 성공하기 위해 개발 생산성을 높이는 실용적인 방법으로 ‘인공지능을 이용해 인공지능을 만드는 기술’ 인 Auto ML이 있다. 즉, 머신러닝 개발 과정에 필요한 반복적이고 소모적인 작업을 자동화하는 프로세스이다. 2018년 AutoML기술이 발표되었으며, 2019년에 나온 논문의 EfficientNet 성능 비교에선 인간이 설계한 것보다 인공지능이 만든 인공지능이 더 높은 성능을 보인다는 결과는 알 수 있다.

AutoML은 규제 산업에서 설명 가능하고 재현 가능한 결과를 제공하는 데 AI 솔루션을 제공한다는 유망한 전망을 제시하고 있다. AutoML을 도입하면 더 단순한 개발 프로세스를 지원할 수 있고, 이 프로세스에 따라 코드 몇 줄로 머신 러닝 모델을 개발하는 데 필요한 코드를 생성할 수 있다.https://www.ibm.com/kr-ko/topics/automl

2.1.1. 필요성

현재의 머신러닝 모델 구축 프로세스는 고도로 숙련된 기술 전문가와 긴 개발 주기, 상당한 비용, 그리고 많은 반복을 필요로 한다. 그럼에도 불구하고 AutoML을 도입해야 하는 이유는 다음과 같다.
기술 격차 해소 모델 출시 시간 단축 비용 절감 모델 성능 향상
AI와 ML의 전문성 차이? 출시 기간 단축 경쟁 비용 절감을 통한 경쟁 하이퍼파라미터의 반복

1. 기술 격차 해소
AI와 ML 분야에서의 기술 전문성 격차는 계속해서 존재한다. 기업은 모델 구축에 필요한 도메인 지식과 기술을 갖춘 전문가를 찾는 데 어려움을 겪고 있다. AutoML은 비전문가도 쉽게 머신러닝을 사용할 수 있게 하여 고도로 전문화된 인력을 고용하지 않아도 되게 하며, 이로써 혁신과 머신러닝 도입이 가속화된다.

2. 모델 출시 시간 단축
빠르게 변화하는 환경에서 출시 기간 단축은 경쟁 우위를 확보하는 데 매우 중요하다. 머신러닝 파이프라인을 자동화하면 모델을 구축하는 데 소요되는 시간이 줄어들며, 새로운 기업이 해당 분야에 진입하여 빠르게 성공적인 솔루션을 제공할 수 있게 된다.

3. 비용 절감
ML 모델을 처음부터 구축하는 데는 많은 비용과 시간이 소요된다. 데이터 과학자나 ML 전문가는 높은 비용을 초래하기도 한다. 이때, AutoML 도구는 초기 모델 구축에 필요한 기술과 노력에 대한 투자를 줄여 비용을 절감하고 효율적인 솔루션을 제공한다.

4.모델 성능 향상
AutoML은 수동으로 수행될 때보다 빠르게 모델과 하이퍼파라미터를 반복하며, 이는 일반적으로 높은 성능의 모델을 선택할 수 있도록 한다. AutoML은 의사 결정 프로세스의 효율성을 높이고 모델 연구를 가속화한다. 또한, AutoML은 심층 신경망을 위한 고성능 아키텍처를 자동으로 검색하고 평가하여 ML 솔루션 개발을 가속화하는 등 모델 개선을 위한 기술적 어려움을 극복한다.https://blt.kr/TechCheck/?q=YToxOntzOjEyOiJrZXl3b3JkX3R5cGUiO3M6MzoiYWxsIjt9&bmode=view&idx=17225380&t=board

2.2. 역사

모든 머신러닝 시스템에는 하이퍼파라미터가 있으며 자동머신러닝의 가장 기본적인 작업은 이러한 하이퍼파라미터를 자동으로 설정해 성과를 최적화하는 것이다. 특히 최근의 심층 신경망은 신경망의 구조, 규제화, 최적화에 관한 광범위한 하이퍼파라미터에 결정적으로 의존한다. 자동화된 하이퍼파라미터 최적화(HPO)에는 몇 가지 중요한 사용 사례가 있으며 이를 통해,
최적화 예시 1번 2번 3번
인적 노력 감소 알고리즘 능력 향상 재현성 공정성 개선

1. 머신러닝을 적용하는 데 필요한 인적 노력을 줄인다. 이것은 특히 AutoML의 맥락에서 중요하다.
2. 머신러닝 알고리즘의 성과를 향상시킨다. 이는 여러 연구에서 중요한 머신러닝 벤치마크에 대한 새로운 첨단 성과를 산출했다.
3. 과학 연구의 재현성과 공정성을 개선한다. 자동화된 HPO는 분명히 수동 탐색보다 재현 가능하다. 그것은 서로 다른 방법들이 모두 당면한 문제에 대해 동일한 수준의 조정을 받는 경우에만 공정하게 비교될 수 있기 때문에 공정한 비교를 용이하게 한다.

HPO 문제는 1990년대로 거슬러 올라가는 긴 역사를 갖고 있으며, 서로 다른 하이퍼파라미터 설정이 데이터셋에 따라 가장 잘 작동하는 경향이 있다는 것도 일찍이 확립됐다. 대조적으로 [A]HPO를 특정 응용 도메인에 범용 파이프라인을 적응시키는 데 사용할 수 있다는 것은 다소 새로운 통찰이다. 또한 오늘날에는 조정된 하이퍼파라미터가 일반적인 머신러닝 라이브러리에 의해 제공되는 기본 설정보다 성과가 좋다는 것이 널리 인정되고 있다.

기업에서 머신러닝의 사용이 증가함에 따라 HPO는 또한 상당한 상업적 관심 대상이 됐으며 기업 내부 도구, 머신러닝 클라우드 서비스의 일부로서, 또는 그 자체로 서비스를 제공하건 어느 때보다도 더 큰 역할을 하고 있다.[2]

3. AutoML 방법

3.1. 하이퍼파라미터 최적화

3.1.1. 블랙박스 하이퍼파라미터 최적화

일반적으로 모든 블랙박스 최적화 방법을 HPO에 적용할 수 있다. 글로벌 최적화 알고리즘이 보통 선호되지만, 문제의 비블록성 때문에 최적화 프로세스의 국지성이 흔히 유용하게 사용된다.

(1) 모델 프리 블랙박스 최적화 방법
그리드 탐색은 완전 팩토리얼 설계라고도 하는 가장 기본적인 HPO 방법이다.

[문제점]
1. 사용자는 각 하이퍼파라미터에 대해 제한된 값의 집합을 지정하고 그리드 탐색은 이러한 집합의 카티션 곱을 평가한다. 이는 필요한 함수 평가 횟수가 설정 공간의 차원성에 따라 기하급수적으로 증가하기 때문에 차원의 저주에 시달린다.
2. 이산화의 밀도를 증가시키면 함수 평가의 필요 횟수가 굉장히 증가한다.

[대안]
1. 랜덤 탐색
랜덤 탐색은 탐색에 대한 특정 예산이 소진될 때까지 랜덤하게 설정을 추출한다. 이는 일부 하이퍼파라미터가 다른 파라미터보다 훨씬 더 중요할 경우 그리드 탐색보다 더 효과적이다. 그리고 좀 더 쉬운 병렬화와 유연한 자원 할당을 포함한다. 랜덤 탐색은 최적화되는 머신러닝 알고리즘에 대한 가정을 하지 않고, 충분한 자원이 주어진다면 최적의 성과에 임의로 근접한 성과를 달성할 수 있기 때문에 유용한 기준이다. 따라서 더욱 복잡한 최적화 전략과 함께 랜덤 탐색을 결합하는 것은 최소한의 수렴 속도를 보장할 수 있으며 모델 기반 탐색을 개선할 수 있는 탐험을 추가한다. 전체 설정 공간을 탐색해 합리적인 성과의 설정을 찾는 경우가 많기 때문에 탐색 프로세스를 초기화하는 데 유용한 방법이다.

2. 베이지안 최적화
베이지안 최적화는 큰 비용의 블랙박스 함수의 글로벌 최적화를 위한 최첨단 최적화 프레임워크로, 최근에는 영상 분류, 음성 인식 및 신경 언어 모델링의 심층신경망 튜닝에 대한 새로운 최첨단 결과를 얻고, 다양한 문제 설정에 대한 광범위한 적용 가능성을 시현함으로 HPO에서 견인력을 얻고 있다. 베이지안 최적화의 최근의 많은 발전은 더 이상 HPO를 블랙박스로 취급하지 않는다. 예로서 다중 충실도 HPO, 메타러닝을 통한 베이지안 최적화, 파이프라인 구조를 고려한 베이지안 최적화를 들 수 있다. 더욱이 베이지안 최적화의 최근의 많은 발전은 HPO를 직접 목표로 하는 것이 아니라, 새로운 획득함수, 새로운 모델과 커널, 새로운 병렬화 체계와 같이 베이지안 최적화를 HPO에 쉽게 적용될 수 있도록 하는 방향으로 일어나고 있다. 베이지안 최적화는 확률적 대리 모델과 다음에 어떤 포인트를 평가할지를 결정하는 획득함수라는 두 가지 핵심 성분을 가진 반복 알고리즘이다. 각 반복 시행에서 대리 모델은 지금까지 만들어진 타깃함수의 모든 관측치에 적합화된다. 베이지안 최적화는 확률적 대리 모델과 다음에 어떤 포인트를 평가할지를 결정하는 획득함수라는 두 가지 핵심 성분을 가진 반복 알고리즘이다. 각 반복 시행에서 대리 모델은 지금까지 만들어진 타깃함수의 모든 관측지에 적합화된다. 그런 다음 확률론적 모델의 예측 분포를 사용하는 획득함수는 탐험과 활용을 절충하면서 상이한 후보 포인트의 효용을 결정한다. 비용이 큰 블랙박스 함수를 평가하는 것에 비해 획득함수는 계산 비용이 저렴해 용이하게 최적화할 수 있다.[3]

3.1.2. 다중 충실도 최적화

데이터셋 크기 증가와 더 복잡한 모델들은 블랙박스 성과 평가를 더 비싸게 만들기 때문에 HPO의 주요 장애물이다. 대규모 데이터셋에서 단일 하이퍼파라미터 설정을 훈련하는 것은 오늘날 대여섯 시간을 쉽게 초과할 수 있으며 최대 며칠이 소요될 수 있다. 따라서 수동 튜닝 속도를 높이는 일반적인 기법은 단지 몇 번의 반복 시행으로 훈련하거나, 특성의 부분집합에서 이를 실행하거나, 또는 교차 검증 폴드의 하나 또는 몇 개만 사용하거나, 컴퓨터 비전의 다운 샘플링을 사용하는 것에 의해 데이터의 작은 부분집합에서 알고리즘/하이퍼파라미터 설정을 탐색하는 것이다. 다중 충실도 방법은 그러한 수작업 [B]휴리스틱스를 정식 알고리즘에 넣어 실제 [C]손실함수의 소위 저충실도 근사치를 사용해 최소화한다.
첫째 둘째 셋째
모델링 유한 집합 학습 곡선 외삽법

첫째, 훈련 중에 알고리즘의 학습 곡선을 모델링하는 방법을 검토하고 만약 추가 자원을 추가하는 것이 도움이 되지 않을 것으로 예상되면 훈련 절차를 중단할 수 있다.

둘째, 주어진 알고리즘/하이퍼파라미터 설정의 유한 집합 중 하나만 선택하는 간단한 선택 방법에 관해 논의한다.

셋째, 최적 하이퍼파라미터를 찾기 위한 대부분의 정보를 제공하는 충실도를 능동적으로 결정할 수 있다는 다중 충실도 방법에 관해 논의한다. 학습 곡선 외삽법은 예측 종료의 맥락에서 사용된다. 이 논문에서 학습 곡선 모델을 사용해 설정을 위해 부분적으로 관찰된 학습 곡선을 추론하고, 설정이 최적화 과정에서 지금까지 훈련된 최상의 모델의 성과에 도달하지 못할 것으로 예측되면 훈련 과정을 중단한다. 밴딧 기반 알고리즘 선택 방법은 연속적 반감 알고리즘과 관련이 있는데, 그것은 매우 간단하지만 강력하며, 따라서 다중 충실도 알고리즘 선택을 위한 인기 있는 전략이다. 주어진 초기 예산에 대해 해당 예산에 대한 모든 알고리즘을 조회한 다음, 최악의 성과를 거둔 절반은 제거하고 예산을 두 배로 늘리는 식으로 하나의 알고리즘만 남게 될 때까지 연속적으로 반복한다.[6]

3.2. 메타러닝

메타러닝은 지도 작업에 국한되지 않으며 강화학습, 능동학습, 밀도추정, 항목 추천 등 다양한 과제를 해결하기 위해 성공적으로 적용됐다. 메타 학습기가 지도되는 동안 기본 학습기는 비지도될 수 있지만, 다른 조합도 확실히 가능하다. Duan 등 범용 슬로우 메타-RL 알고리즘에 의해 유도되는 작업 특화의 고속 RL 알고리즘으로 구성된 엔드-투-엔트 강화학습 접근법을 제안한다. 그 작업들은 상호 연관된 마르코프 의사 결정 과정이다. 메타-RL 알고리즘은 관측, 행동, 보상 및 종료 플래그를 입력으로 받는 RNN으로 모델링된다. RNN의 활성화는 고속 RL 학습기의 상태를 저장하며, RLL의 가중치는 작업 전반에 걸친 고속 학습기의 성과를 관찰함으로써 학습된다. 이와 병행해 Wang 등은 또한 특정 작업에 대한 기초 수준 RL 알고리즘을 학습하기 위해 이전 구간의 행동과 보상을 입력으로 RNN을 훈련하기 위해 심층 RL 알고리즘을 사용할 것을 제안했다. 랜덤 MDP와 같은 상대적으로 비정형화된 작업을 사용하기보다는 메타-RL 알고리즘이 내재된 작업 구조를 활용할 수 있는 구조화된 작업 분포에 초점을 맞춘다. Pang 등은 능동 학습에 대한 메타 학습 접근법을 제공한다. 기본 학습기는 어떤 이진 분류기도 될 수 있으며, 메타 학습기는 작업 전반에 걸쳐 AL 문제의 표현을 학습하는 심층 신경망과 네트워크의 가중치로 [D]파라미터화되는 최적의 정책을 학습하는 정책 네트워크로 구성된 심층 RL 네트워크이다. 메타 학습기는 현재 상태와 보상을 입력으로 받고, 레이블이 없는 집합 중 어떤 점을 다음에 검색할지의 검색 확률을 방출한다. Reed 등은 밀도 추정을 위한 소수 사례 접근법을 제안한다. 목표는 특정 개념의 이미지를 생성하는 데 사용할 수 있는 소수의 이미지에 대한 확률 분포를 학습하거나 어떤 이미지가 그 개념을 보여주는 확률을 계산하는 것이다. 이 접근법은 결합 분포를 픽셀당 팩터로 팩터화하는 자기 회귀 이미지 모델을 사용한다. 일반적으로 이들은 타깃 개념의 예제에 따라 조건화된다. 대신 MAML 기반의 소수 사례 학습기를 사용해 많은 개념의 예제에 대해 훈련한다.[8]

파일:메타러닝.png

4. AutoML 시스템

4.1. 오토웨카

CASH 문제를 해결하기 위한 자동 접근법의 실현 가능성을 입증하기 위해 [E]웨카 머신러닝 패키지에서 구현된 학습기와 함수 추출기를 위해 이 문제를 해결하는 오토웨카를 구축했다. 웨카의 분류 알고리즘에 초점을 맞췄지만, 다른 설정으로 접근법을 확장하는 데는 아무런 장애물이 없다.[10]

4.2. 하이퍼옵트 사이킷런

하이퍼옵트 라이브러리는 알고리즘 설정에서 발생하는 탐색공간을 위한 최적화 알고리즘을 제공한다. 이러한 공간은 다양한 변수 유형, 서로 다른 민감도 프로파일 및 조건부 구조로 특정지어진다. 하이퍼옵트를 사용하려면 사용자는 탐색 도매인, 목적함수, 최적화 알고리즘의 세 가지를 정의/선택해야 한다. 탐색 도매인은 랜덤 변수를 통해 지정되며, 가장 유망한 조합이 높은 사전 확률을 갖도록 분포를 선택해야 한다. 탐색 도매인에는 파이썬 연산자와 목적함수를 위해 랜덤 변수를 더욱 편리한 데이터 구조로 결합하는 함수가 포함될 수 있다. 이 도매인 내에서 모든 조건부 구조가 정의된다. 목적함수는 이러한 랜덤 변수의 공동 표본을 최적화 알고리즘이 최소화하려고 시도할 스칼라 값 함수에 매핑한다. 모델 선택은 무한한 옵션 집합 주에서 어떤 머신러닝 모델이 가장 잘 수행되는지 추정하는 과정이다. 최적화 문제로서 탐색 도매인은 머신러닝 모델의 설정 파라미터에 대한 유효한 할당 집합이다. 목적함수는 일반적으로 보류된 예에서 성공의 척도이다. 종종 부정적인 성공 정도를 사용해 작업을 최소화 문제로 설정하고 교차 검증을 적용해 더 강건한 최고 점수를 산출한다. 실무자는 일반적으로 이 최적화를 수동, 그리드 탐색 또는 랜덤 탐색을 통해 다룬다. 사이킷런은 데이터로부터 학습하기 위한 많은 알고리즘과 이러한 학습 알고리즘이 입력으로 기대하는 벡터로 데이터를 [F]전처리하기 위한 많은 알고리즘을 포함한다, 사이킷런은 일련의 전처리 단계와 분류기 또는 회귀기에 대한 파라미터화를 제공한다.[12]

파일:사이킷런.jpg

4.3. 오토사이킷런

먼저 오토웨카의 AutoML 접근법에 의해 사용되는[G]CASH 문제로 AutoML의 공식화를 검토한다. AutoML의 두 가지 중요한 문제는 모든 데이터셋에서 최상의 성과를 내는 단일 머신러닝 방법이 없다는 것과 일부 머신러닝 방법은 하이퍼파라미터 최적화에 결정적으로 의존한다는 것이다. 후자 문제는 오늘날 많은 AutoML 시스템의 핵심 구성 요소를 형성하는 베이지안 최적화를 사용해 성공적으로 다뤄지고 있다. 알고리즘의 순위는 하이퍼파라미터가 제대로 조정됐는지 여부에 달려 있기 때문에 전자의 문제는 후자와 얽혀 있다. 다행히 두 가지 문제는 구조화된 단일 공동 최적화 문제로 효율적으로 해결할 수 있다. 강건한 AutoML 시스템을 설계하기 위해 기본 ML 프레임워크로 가장 잘 알려져 있고 가장 널리 사용되는 머신러닝 라이브러리 중 하나인 사이킷런을 선택했다. 잘 확립되고 효율적으로 구현된 다양한 ML 알고리즘을 제공하며, 전문가와 초보자 모두에게 사용하기 용이하다. AutoML 시스템은 오토웨카와 매우 유사하지만, 하이퍼옵트 사이킷런과 마찬가지로 사이킷런을 기반으로 하기 때문에 오토사이킷런이라고 한다.[14]

4.4. 딥신경망의 자동 튜닝

4.4.1. 오토넷 1.0

새로운 분류 구성 요소를 추가해 오토넷의 첫 번째 버전을 오토사이킷런의 확장으로 구현하기로 선택했다. 이러한 선택의 이유는 늑성 전처리, 데이터 [H]전처리 및 앙상블 구성이라는 머신러닝 파이프라인의 기존 부분을 활용할 수 있기 때문이다. 여기서 오토넷이 다양한 데이터셋에 적용되기 때문에 완전 결합 전방향 신경망으로의 확장은 향후 작업으로 연기한다. 신경망 기술에 접근하기 위해 테아노를 기반으로 구축된 파이썬 딥러닝 라이브러리 라자냐를 사용한다. 그러나 일반적으로 그 접근법이 신경망 구현과 독립적이라는 점에 주목한다.[16]

4.4.2. 오토넷 2.0

오토넷 2.0은 주로 다음 세 가지 측면에서 오토넷 1.0과 다르다. 첫번 째로는 심층 학습 라이브러리로 라자냐 대신 파이토치를 사용한다.
두번 째로는 최신 딥러닝 기술, 최신 아키텍처를 포함한 더 큰 설정 공간을 사용하며 탐색 공간을 더욱 간결하게 표현한다. 세번 째로는 성능이 우수한 신경망을 좀 더 효율적으로 얻기 위해 SMAC 대신 BOHB을 사용한다.[17]

4.5. 자동 통계 전문가 시스템

4.5.1. 시계열 데이터에 대한 자동 통계 전문가 시스템

다양한 목표에 대해 정의될 수 있으며 여러 기본 모델군에 기초할 수 있다. 자동 베이지안 공분산 탐색이라고 부르는 이들의 시스템은 커널에 대한 구성 문법을 통해 가우시안 프로세스 모델의 개방형 언어를 사용한다. 가우시안 프로세스는 함수에 대한 분포를 정의하고 평균과 커널의 파라미터는 함수의 속성을 결정한다. 특정한 속성을 가진 함수 분포를 유도하는 광범위한 커널 선택이 있다.[18]

5. 현황 및 시 동향

5.1. 현황

5.1.1. 사물인터넷(IoT) 기기의 급증

IoT의 급증은 AutoML 시장 성장에 기여하고 있습니다. 센서, 소프트웨어 및 기타 기술이 내장된 IoT장비는 인터넷을 통해 다른 장비 또는 시스템과 데이터를 교환합니다. IoT 기기의 급격한 증가로 인해 귀중한 인사이트를 얻을 수 있는 방대한 양의 데이터가 생성되고 있습니다. AutoML은 IoT 기기에서 생성된 데이터에서 의미 있는 정보를 추출하기 위한 머신러닝 모델 개발을 용이하게 합니다. 체코에 본사를 둔 온라인 미디어 업체인 TechJury Official에 따르면 2022년에는 약 426억 2,000만 개의 IoT 기기, 센서, 액추에이터가 설치될 것으로 예상되며, 이는 2021년 358억 2,000만 개, 2020년 307억 3,000만 개에 비해 크게 증가한 수치입니다. 증가했습니다. IoT 장비 증가는 자동 기계학습(AutoML) 시장의 성장을 가속할 것입니다.https://www.giikorea.co.kr/report/tbrc1428456-automated-machine-learning-automl-global-market.html?CODE=tbrc1428456-automated-machine-learning-automl-global-market.html&TYPE=0

5.1.2. 자동 머신러닝(AutoML)의 성능이 향상

데이터 과학과 인공지능 향상으로 AutoML의 성능이 향상되었습니다. 기업은 이 기술의 잠재력을 인식하고 있기 때문에 예측 기간 동안 채용률이 높아질 수 있습니다. 기업은 AutoML 솔루션을 구독 기반으로 판매하여 고객이 이 기술을 쉽게 사용할 수 있도록 합니다. 또한 [G]종량 과금제로 유연성을 제공합니다.
ML은 많은 응용 분야에서 점점 더 많이 사용되고 있지만, 이러한 성장을 적절히 지원하기 위해서는 머신러닝 전문가가 부족합니다. AutoML의 목적은 머신 러닝을 보다 편리하게 사용하는 것입니다. 따라서 전문가는 더 많은 머신러닝 시스템을 배포할 수 있어야 하며 AutoML을 조작할 때 필요한 전문 지식은 ML을 직접 조작하는 경우보다 적습니다. 그러나 기술 도입은 여전히 얕고 시장 성장이 억제되고 있습니다.
COVID-19의 유행 이후 기업이 비즈니스 프로세스를 자동화하기 위한 지능형 솔루션의 활용을 향해 움직이기 시작하여 AI 도입이 증가하고 있습니다. 이러한 추세는 향후 수년간 지속될 것으로 예상되며, 조직 프로세스에서 AI의 도입이 더욱 촉진될 것입니다.
KBV Cardinal의 매트릭스 분석에 따르면, Microsoft Corporation과 Google LLC(Alphabet Inc.)가 시장 선두를 달리고 있으며, 2023년 5월 구글 클라우드는 오픈 데이터와 AI의 미래를 공동으로 구축하기 위해 SAP와의 파트너십을 확대하여 데이터 환경을 용이하게 하기 위해 개발된 본격적인 오픈 데이터 제공을 시작했습니다. 이 제공을 통해 사용자는 데이터를 구축할 수 있으며, Amazon Web Services, Inc. 시장의 주요 혁신가입니다.https://www.giikorea.co.kr/report/moi1445737-automated-machine-learning-market-share-analysis.html?CODE=moi1445737-automated-machine-learning-market-share-analysis.html&TYPE=0

5.2. 시장 동향

최근 은행/금융서비스/보험(BFSI) 업계에서는 업무 효율성을 높이고 소비자 경험을 향상시키기 위해 인공지능(AI)과 기계 기술 채택이 증가하고 있습니다. 데이터에 대한 관심이 높아짐에 따라 머신러닝 BFSI 용도에 대한 수요가 증가하고 있습니다. 자동화된 머신러닝은 방대한 데이터, 저렴한 처리 능력, 경제적 스토리지를 사용하여 정확하고 신속한 결과를 생성할 수 있습니다.

또한 머신러닝(ML)을 활용한 솔루션을 통해 금융회사는 지능형 프로세스 자동화를 통해 반복적인 업무를 자동화하고 기업의 생산성을 향상시켜 육체 노동을 대체할 수 있습니다. 예측된 기간에 걸쳐 예로는 채팅봇, 사무처리 자동화, 직원 교육 게이미피케이션 등이 있습니다. 머신러닝은 재무 프로세스를 자동화하는 데 사용할 것으로 예상됩니다.

COVID-19의 유행 이후 금융기관은 디지털 채널을 통해 고객에게 도달하고 지원하는 데 관심이 높아지고 있습니다. 채팅봇, 계좌 개설 및 관리 지원, 기술 지원 등 다양한 디지털 솔루션의 도입이 금융 분야에서 급증하고 있습니다. 주목할 만하게 Posh.Tech, Spixii 및 기타 수많은 Fintech 기업은 은행에 중요한 고객 대응 기능을 홍보하도록 설계된 지능형 채팅봇을 제공합니다.

머신러닝(ML)은 인공지능(AI)의 하위 영역으로, 교육 알고리즘이 통계적 기법을 통해 분류 및 예측을 수행할 수 있게 하고 데이터 마이닝 프로젝트 내에서 중요한 인사이트을 드러냅니다. 이러한 인사이트은 용도 및 비즈니스 내 의사결정을 촉진하며, 이상적으로는 주요 성장 지표에 영향을 미칩니다. 이는 알고리즘, 모델 및 계산 복잡성을 중심으로 전개되므로 숙련된 전문가가 이러한 솔루션을 개발해야 합니다.

머신러닝(ML)은 비즈니스의 많은 부분에서 필수적인 구성 요소가 되었습니다. 반면에 고성능 머신러닝 용도을 구축하려면 고도로 전문화된 데이터 과학자와 도메인 전문가가 필요합니다. 자동 머신 러닝(AutoML)은 통계 및 머신 러닝에 대한 충분한 지식 없이도 도메인 전문가가 머신 러닝 용도을 자동으로 구축할 수 있도록 함으로써 데이터 과학자의 요구를 완화하는 것을 목표로 하고 있습니다.https://www.giikorea.co.kr/report/moi1445737-automated-machine-learning-market-share-analysis.html?CODE=moi1445737-automated-machine-learning-market-share-analysis.html&TYPE=0

6. 향후 개발 전망

6.1. 향후 개발 전망

선도적인 자동화 기술인 AutoML은 향후 개발에 큰 잠재력을 가지고 있다.

6.1.1. 실력이 향상

인공지능 기술이 계속 발전함에 따라 AutoML의 알고리즘과 방법도 계속해서 개선될 것이다. 더욱 스마트한 검색 알고리즘과 더욱 효율적인 튜닝 전략이 계속해서 등장하여 AutoML이 더욱 강력하고 효율적으로 만들어질 것이다.

6.1.2. 분야 확장

현재 AutoML은 지도 학습 분야에서 주로 사용되고 있으나, 기술의 발전에 따라 점차 비지도 학습, 강화 학습 등의 분야로 확대될 것으로 예상된다. 이를 통해 다양한 분야에서 머신러닝 기술의 적용이 더욱 촉진될 것이다.

6.1.3. 개인화된 맞춤화

앞으로 AutoML은 사용자 요구와 데이터 특성을 기반으로 맞춤형 머신러닝 모델을 자동으로 생성할 수 있을 것이다. 이를 통해 기계 학습이 실제 애플리케이션에 더 가까워지고 모델의 유용성이 높아진다.

6.1.4. 모델 해석 가능성

AutoML의 인기로 인해 모델의 해석 가능성이 점점 더 중요해질 것이다. 앞으로 AutoML은 모델 설명에 대한 사용자의 요구 사항을 충족하기 위해 해석 가능성이 높은 모델을 생성하는 데 더 중점을 둘 수 있다. 완전 자동화된 AutoML은 의심할 여지 없이 향후 머신러닝 개발을 위한 중요한 방향이다. 기계 학습의 여러 측면을 자동화함으로써 모델 구축의 효율성을 향상하고 진입 장벽을 낮추며 더 많은 사람들에게 기회를 제공한다. AutoML은 여전히 기술적 과제에 직면해 있지만 기술이 계속해서 발전함에 따라 AutoML이 미래에 점점 더 중요한 역할을 할 것이라고 믿을 만한 이유가 있다. AutoML은 머신러닝 기술 발전을 촉진할 뿐만 아니라, 인공지능을 보다 폭넓은 분야에 적용해 미래 기술 발전 트렌드를 선도해 나갈 것이다.


[A] 초매개변수{하이퍼파라미터라고도 부르는 것으로, 분석 중인 기본시스템에 대한 모델의 매개변수(두 개 이상의 변수 사이에서 함수 관계를 정하기 위하여 쓰이는 또 다른 하나의 변수)와 이를 구별하는데 사용된다.}를 최적화하는 방법[2] Automated Machine Learning: Hyperparameter optimization, neural architecture search, and algorithm selection with cloud platforms (ISBN 9781800567689)[3] 자동머신러닝 AutoML 창시자가 알려주는 저자 프랭크 허터, Lars Kotthoff 외 | 역자 이기홍 출판 에이콘출판 | 2021.12.31.[B] 정보화 처리과정과 관련된 의사결정 모델로 심리학자 카한만과 트버스기에 의해 제시된 것으로서, 의사결정을 하는 데 있어 '어떻게 판단 오류가 발생하는가'에 대해 설명하고 있다. 그들은 의사결정자가 결정이나 판단을 함에 있어 단순사고와 주먹구구식 편법에 의한 것도 가정하고 있다. 그러므로 이로 인해 판단 오류가 발생하게 되어, 그러한 오류들을 체계적으로 정리함으로써 왜곡된 선택의 과정을 이해하고, 올바른 의사결정에 도움을 주고자 하였다.[C] 제어계 용어로, 특정함수의 상태를 유지하는데 필요한 총 비용의 순간적인 평가치[6] 자동머신러닝 AutoML 창시자가 알려주는 저자 프랭크 허터, Lars Kotthoff 외 | 역자 이기홍 출판 에이콘출판 | 2021.12.31.[D] 프로그램을 실행할 때 명령의 세부적인 동작을 구체적으로 지정하는 숫자나 문자[8] 자동머신러닝 AutoML 창시자가 알려주는 저자 프랭크 허터, Lars Kotthoff 외 역자 이기홍 출판 에이콘출판 | 2021.12.31.[E] 기계학습 소프트웨어 제품군으로, 뉴질랜드 와이카토 대학교에서 개발된 자유 소프트웨어이다.[10] 자동머신러닝 AutoML 창시자가 알려주는 저자 프랭크 허터 , Lars Kotthoff 외 | 역자 이기홍 출판 에이콘출판 | 2021.12.31.[F] 기본 반응이나 가공에 앞서 화학적, 물리적 작용을 가하여 예비적으로 하는 처리[12] 자동머신러닝 AutoML 창시자가 알려주는 저자 프랭크 허터 , Lars Kotthoff 외 | 역자 이기홍 출판 에이콘출판 | 2021.12.31.[G] 말그대로 재화 문제[14] 자동머신러닝 AutoML 창시자가 알려주는 저자 프랭크 허터 , Lars Kotthoff 외 | 역자 이기홍 출판 에이콘출판 | 2021.12.31.[H] 기본 반응이나 가공에 앞서 화학적, 물리적 작용을 가하여 예비적으로 하는 처리[16] 자동머신러닝 AutoML 창시자가 알려주는 저자 프랭크 허터 , Lars Kotthoff 외 | 역자 이기홍 출판 에이콘출판 | 2021.12.31.[17] 자동머신러닝 AutoML 창시자가 알려주는 저자 프랭크 허터 , Lars Kotthoff 외 | 역자 이기홍 출판 에이콘출판 | 2021.12.31.[18] 자동머신러닝 AutoML 창시자가 알려주는 저자 프랭크 허터 , Lars Kotthoff 외 | 역자 이기홍 출판 에이콘출판 | 2021.12.31.[G] 사용한 만큼만 비용을 지불하는 제도

분류