LLM의 종류와 특징 비교
LLM의 종류와 특징 비교
주요 LLM 종류 와 특징
모델명 | 대표 버전/용량 | 성능/기능 특징 | 오픈소스 여부 | 지원 환경 | 확장 기능/특이점 |
GPT 시리즈 (OpenAI) | GPT-3 (175B), GPT-4, GPT-4o 등 | 텍스트 생성, 고급 추론, 코드 작성, 멀티모달(GPT-4o) 등. 최신 버전일수록 정확도와 멀티모달 처리 능력 향상[2][4][7] | 비공개(상업 API) | 클라우드(웹, API), MS Copilot 등 | 플러그인, 인터넷 액세스, 코드 해석, 이미지 처리 등[12] |
Gemini (Google) | Gemini 1.5 등 | 멀티모달(텍스트+이미지) 강점, 구글 생태계 연동, 빠른 응답 속도[5][7] | 비공개(상업 API) | 클라우드(Google Workspace 등) | 구글 서비스와 통합, 이미지 분석/생성 탁월[5] |
Claude (Anthropic) | Claude 2, Claude 3 | 안전성·윤리성 강화, 대용량 입력(최대 10만 토큰), HHH(Helpful, Honest, Harmless) 모델[6][11] | 비공개(상업 API) | 클라우드(웹, API) | 긴 문서 처리, 구조적 데이터 편집/요약/분류[11] |
LLaMA (Meta) | LLaMA 2 (7B/13B/70B), LLaMA 3 (8B~70B) | 오픈소스, 높은 효율성, 소규모 서버에서도 우수한 성능, 다양한 크기[10][11] | 오픈소스 | 온프레미스, 클라우드, 로컬 | 파인튜닝 용이, 다양한 커뮤니티 확장[10] |
BERT 계열 (Google) | BERT, RoBERTa 등 | 문맥 이해, 문장 분류·QA에 강점, 사전학습+파인튜닝 구조[1][2] | 오픈소스 | 온프레미스, 클라우드 | 다양한 파생 모델(한국어 KoBERT 등) |
Falcon | Falcon 180B | 오픈소스 초대형(180B), 번역·생성·연구에 강점[10] | 오픈소스 | 온프레미스, 클라우드 | 대규모 데이터셋 활용, 다양한 언어 지원 |
Mistral | Mistral 7B | 소형(7B)임에도 효율성·성능 우수, 셀프호스팅 적합[10] | 오픈소스 | 온프레미스, 클라우드 | 경량화, 빠른 추론, 다양한 NLP 작업 활용 |
LLM 세부 특징 요약
1. 용량
- GPT, Gemini, Claude 등은 100억~1,000억+ 파라미터급 대형 모델.
- LLaMA, Mistral, Falcon 등은 7B~180B 등 다양한 크기 제공, 환경에 맞게 선택 가능[10][11].
2. 성능
- GPT-4, Gemini, Claude 3 등 최신 모델은 복잡한 추론, 멀티모달, 대용량 입력에서 우수.
- LLaMA 3, Mistral 7B 등은 소형임에도 효율적 추론과 높은 벤치마크 점수 기록[10][6].
3. 기능
- 텍스트 생성, 요약, 번역, 코드 작성, 이미지 처리(멀티모달), 긴 문서 처리, 구조적 데이터 편집 등.
- GPT-4o, Gemini 등은 이미지·음성 등 멀티모달 지원[5][7][10].
4. 오픈소스/비공개
- LLaMA, Falcon, Mistral, BERT 계열은 오픈소스.
- GPT, Gemini, Claude 등은 상업용 API로 제공[10][11].
5. 지원 환경
- 클라우드 API(웹, 앱, SaaS), 온프레미스(로컬 서버), 컨테이너 기반 배포 등 다양[8][10].
6. 확장 기능
- 플러그인, 인터넷 액세스, 코드 인터프리터, 파인튜닝, Chain-of-Thought 등 다양한 확장 기법 존재[9][12].
- LLM Agent, 멀티에이전트 협업, 자동화된 워크플로우 등 최신 활용법 확산 중[9][5].
참고: 폐쇄형 vs. 개방형 LLM
구분 | 폐쇄형 (상업 API) | 개방형 (오픈소스) |
대표 예시 | GPT-4, Gemini, Claude | LLaMA, Falcon, Mistral, BERT |
인프라 | 클라우드 제공, 관리 용이 | 직접 구축 필요, 커스터마이즈 용이 |
확장성 | 제한적(벤더 정책 영향) | 자유로운 파인튜닝/배포 가능 |
보안 | 벤더 신뢰 필요 | 자체 보안 정책 적용 가능 |
인용:
[1] LLM(대규모 언어 모델) 소개 및 종류 : GPT/BARD/BERT/PaLM/LLaMA https://blog.naver.com/pso164/223386153743
[2] LLM: 대규모 언어 모델의 원리, 종류, 그리고 활용 방법 - Be great https://bgreat.tistory.com/223
[3] LLM이 무엇일까? : LLM부터 머신러닝까지 한 번에 맛보기 https://spartacodingclub.kr/blog/2024-ai-llm
[4] LLM 인공지능(AI) 대표 5개 모델 특징과 장단점 및 활용 방법 정리 https://blog.naver.com/sys725/223537543610
[5] 2025년 LLM 모델 종류 총정리 : 성능 비교, 업무 활용 사례, LLM AGENT https://app.dalpha.so/blog/llm/
[6] LLM 성능 측정 및 비교 방법: 최신 생성형 AI에 대한 종합 가이드 https://www.jangwook.net/how-to-measure-and-compare-llm-performance-a-comprehensive-guide-to-the-latest-generative-ais-kr
[7]
[9] LLM 기능을 확장하는 9가지 'Chain-of-X' 기법 https://turingpost.co.kr/p/llm-9-chain-of-x
[10] 2025년 최고의 대규모 언어 모델(오픈 소스 + 호스팅 LLMs) - Botpress https://botpress.com/ko/blog/best-large-language-models
[11] [인공지능] 대규모언어모델(LLM) 정리 (2023.11 기준) - 글래스 비드 게임 https://futures-studies.tistory.com/entry/%EC%83%9D%EC%84%B1AI-%EB%8C%80%EA%B7%9C%EB%AA%A8%EC%96%B8%EC%96%B4%EB%AA%A8%EB%8D%B8LLM-%EC%A0%95%EB%A6%AC-202311-%EA%B8%B0%EC%A4%80
[12] [LLM] 다양한 LLM Provider 정리 및 선택 가이드 (ChatGPT, Claude ... https://gagadi.tistory.com/59
[13] LLM, 너 진짜 핫하다! 하루 하루 달라지는 LLM! - TEN AI 공식블로그 https://ten1010.tistory.com/entry/LLM-%EB%84%88-%EC%A7%84%EC%A7%9C-%ED%95%AB%ED%95%98%EB%8B%A4-%ED%95%98%EB%A3%A8-%ED%95%98%EB%A3%A8-%EB%8B%AC%EB%9D%BC%EC%A7%80%EB%8A%94-LLM
[14] 언어 모델 비교 - LLM, sLLM, SLM을 알아보자 - 네이버 블로그 https://blog.naver.com/agapeuni/223588333903
[15] LLM 추론 성능 엔지니어링: 모범 사례 | Databricks Blog https://www.databricks.com/kr/blog/llm-inference-performance-engineering-best-practices