인공지능, 특히 딥러닝 모델에서의 양자화(quantization)는 딥러닝 모델을 더 빠르고 더 낮은 메모리 요구 사항으로 실행할 수 있는 저렴하고 쉬운 방법입니다. 딥러닝의 양자화는 정보 압축에 기초를 두고 있습니다. 딥러닝에서는 가중치(모델 파라미터) 및/또는 활성화(activation)의 수치적 정밀도를 줄이는 것을 의미합니다. 모델을 양자화하면 메모리가 작아지고, 소비전력이 줄어듭니다.본 웨비나에서는 딥 러닝에서 양자화의 기초원리에 대해 설명하고, 최신 기술동향 및 여기서 언급된 기술들이 실제로 어떻게 실행되는 지 실제 코딩 데모 실현을 보여줄 계획입니다.
전체댓글 0