|
대형언어모델(LLM)에 비해 SLM은 휴대전화와 노트북과 같은 개인용 기기들에서 작동하며 기계학습과 구동에 드는 비용도 저렴하다.
MS는 파이-3가 지난해 12월 출시한 파이-2보다 성능이 더 뛰어나고, 10배 큰 모델 수준의 응답을 제공할 수 있다고 설명했다. 세바스티엔 부벡 MS 생성형 AI 연구 담당 부사장은 “파이-3는 약간이 아니라 획기적으로 비용이 적게 든다”며 “비슷한 기능을 가진 다른 모델들과 비교했을 때 비용이 10분의 1 수준”이라고 말했다.
AI 모델이 얼마나 많은 복잡한 명령어를 이해할 수 있는지를 나타내는 매개변수도 최소화했다. 파이-3 미니의 매개변수(파라미터)는 38억개로, 앞으로 출시될 매개변수 70억개의 파이-3 스몰(Small)이나 140억개의 파이-3 미디엄(Medium)보다도 적은 규모다.챗GPT의 기반이 되는 LLM GPT-4의 경우 매개변수가 5000억개로 추정된다.
MS는 SLM은 단순한 작업을 수행할 수 있도록 설계돼 한정된 자원을 가진 기업들이 더 쉽게 사용할 수 있다고 강조했다. 에릭 보이드 MS 애저 AI 플랫폼 부사장은 “파이-1은 코딩에 중점을 뒀고 파이-2는 추론을 배우기 시작했지만, 파이-3는 코딩과 추론에 더 능숙하다”고 설명했다.
이에 빅테크업계에서 LLM 경쟁과 함께 SLM 경쟁도 치열해질 전망이다. 앞서 구글은 지난 2월 간단한 챗봇과 언어 관련 작업에 유용한 젬마 2B와 7B를 출시했다. 메타는 지난 18일 ‘라마3’를 출시하면서 파라미터가 700억개인 LLM과 함께 챗봇과 코딩 지원에 사용되는 80억개인 SLM도 선보였다.