본문 바로가기
IT

LLM이란? 모델 인공지능 머신러닝에 대하여!

by 얼리컴티 2023. 6. 4.
반응형

대규모 언어 모델, 혹은 대형 언어 모델이라 불리는 LLM에 대해 상세히 알아봤습니다.


기술 세계에서는 모두가 결국 기생 생물이라 할 수 있습니다. 드루팔을 만든 드리스 보이타르트가 몇 년 전에 말했듯이 사람은 모두 만드는 사람(maker)보다는 취하는 사람(taker)에 가깝다고 합니다. 보이타르트는 오픈소스 커뮤니티의 일반적인 관행을 두고 “취하는 사람은 자신이 이익을 취한 오픈소스 프로젝트에 유의미한 기여로 갚지 않고 의존하는 프로젝트에 해를 끼친다"고 합니다. 
 
기생적 경향은 다른 이의 콘텐츠에 의존하는 구글, 페이스북, 트위터에서도 드러났지만, 현재 생성형 AI에서 훨씬 더 선명하게 나타납니다. 소스그래프(Sourcegraph) 개발자인 스티브 예게는 “LLM은 소셜, 모바일 또는 클라우드 이후의 가장 큰 변화일 뿐만 아니라, 월드 와이드 웹 이후의 가장 큰 변화”라고 주장했는데, 그 말이 맞을 수도 있지만, 대규모 언어 모델(LLM)은 근본 속성이 기생적이라 할 수 있습니다.


오픈소스에서 그랬듯 콘텐츠를 만들고 모아서 배급하는 쪽에서는 콘텐츠에 대한 LLM 접근을 차단하기 시작했습니다. 예를 들어 와이어드(Wired)의 보도에 따르면 사이트 트래픽 감소를 겪고 있는 스택 오버플로우는 레딧과 마찬가지로 LLM 제작자에게 LLM 학습에 스택 오버플로우 데이터를 사용하려면 정당하게 돈을 내라고 요구하고 있습니다. 

 

그렇다면 여기서 언급되고 있는 LLM이 무엇이길래 이러한 내용들이 언급되고 있는 것인지 이번 포스팅을 통해서 상세히 살펴보도록 하겠습니다.

 

 

요즘 새롭게 떠오르고 있는 용어인 LLM은 대형 언어 모델, 혹은 대규모 언어 모델이라 불리고 있으며, 방대한 양의 자연어 데이터를 처리하고 종종 사람이 생성한 텍스트와 구별할 수 없는 응답을 생성할 수 있는 AI 시스템의 일부라고 합니다. 딥러닝 기술을 사용해서 구축되고 책, 기사 및 온라인 콘텐츠와 같은 방대한 양의 텍스트 데이터에 대해서 주로 교육이 진행되고 있기도 합니다.

 

이 시스템의 대표적인 사례도 존재하는데 바로 OpenAI의 GPT와 Google의 BERT 모델이 있습니다. GPT가 이 시스템을 토대로 만들었다는 것이 어찌보면 놀라운 사실이라 할 수도 있겠는데, 이 외에도 언어 번역콘텐츠 생성 및 챗봇을 비롯한 다양한 애플리케이션에서도 사용되고 있습니다.

 

반응형

 

언어는 인간의 의사 소통 외에도 다양하게 사용됩니다. 코드는 컴퓨터의 언어라고 할 수 있죠. 단백질과 분자 서열은 생물학의 언어입니다. 대규모 언어 모델은 다양한 유형의 소통이 필요한 언어나 시나리오에 적용됩니다. 이러한 모델은 산업과 기업 전반에 AI가 활용되는 범위를 넓히고, 세상에서 가장 풀기 힘든 문제에 대한 복잡한 솔루션을 만드는 데 도움을 주기 때문에 연구와 창의성, 생산성 분야에 새로운 장을 열 것으로 기대를 모으고 있습니다.

 

그리고 의료에서 금융, 마케팅에 이르기까지 광범위한 산업에 혁명을 일으킬 수 있는 잠재력을 가지고도 있다하니 이러한 업종에선 상당히 큰 도움을 줄 수 있는 시스템이라고도 할 수 있겠습니다. 그렇다면 이 모델을 사용함으로써 어떤 이점을 가져다줄 수 있을 것인가가 중요시되고 있을 것 같습니다.

 

 

2023.06.03 - [IT] - 서버리스란? 서비스 사례와 장단점은?

2023.06.02 - [IT] - 네트워크 슬라이싱이란? 원리부터 문제점까지!

2023.05.31 - [IT] - 폴라리스 오피스 툴 무료 특징과 단점은?

2023.05.30 - [IT] - 데이터 거버넌스란? 사례와 솔루션 있는가?

반응형

댓글