본문 바로가기

AI 기술 및 트렌드

(2)

맨 처음 돌려보는 AI 모델, 간편한 python xgboost (GBM개선모델) 는 어떠신가요? 머신러닝 모델 이야기를 풀어나가는 것은 어렵다. 왜냐하면 너무나 종류가 많고, 그 이론적인 배경을 모르면 실수하기 쉽고 데이터의 유형에 따라 추천이 거짓말이 되는 경우도 잦다. 이러한 어려움은 학습 시에 적용되는 다양한 random효과와 결합되어 무언가 알 수 없게 되는 상황도 많다고 생각한다. 딥러닝은 최근 수년간 엄청난 성공을 거둔 방법이다. 그러면 딥러닝을 써보면 어떻겠는가? 하지만 딥러닝이 잘 작동하는 분야도 어찌 보면 특정 분야나 상황으로 제약되어 있다. 이미지, 자연어 처리 분야에서 대량의 데이터로 학습한다는 공통점이 있고, 해당 데이터에 따라 벌써 세부적인 모델들이 잘 정의되어 있지 않은가. 이미지 인식의 CNN(Convolutional Neural Network)의 여러 유형들이 그렇다. ..

AI인프라 - 하이브리드 클라우드와 Kubernetes 이야기 머신러닝으로 역사를 이루고자 하는 사람은 클라우드에 관심을 가져야 한다고 생각한다. 거창하긴 하지만, 현대의 역사에 남는 머신러닝 모델들은 대략 수억원 이상의 컴퓨팅을 사용하는 것을 심심찮게 목격할 수 있고, GPT-3는 50억 이상을 썼다고 하는데 잘 나가기만 한다면 내 모델도 언제 그렇게 될지 모르지 않는가! 그리고 이것을 IDC내에 On-prem으로 구성하기 위해서는 당연히 수십 수백억, 수천억의 투자비가 든다. 내가 몸담은 회사가 이 비용을 쿨하게 감내할 수 있다면 그것은 너무나 감사한 일이지만, 대부분은 그렇지 않다. 더군다나 프로세서는 GPU, TPU 등등 으로 계속 진화하고 있는 마당이라 언제 구축을 하든 노후화 가능성이 상존한다. 병렬 처리 인프라나 관련 SW도 계속 변화할 것이다. 분석 ..

티스토리툴바