728x90
반응형

LLM 10

AI & Tech 데일리 브리핑 — 2026년 4월 30일

AI & Tech 데일리 브리핑 — 2026년 4월 30일발행일: 2026년 4월 30일기간: 2026.04.27 ~ 04.30분야: #AI서비스 / #피지컬AI / #에이전트 #AI인프라 /#보안규제 / #AI모델경쟁 / #자율지능■ 요약시사점2026년 4월 마지막 주, AI 산업의 세 가지 전환이 동시에 가시화됐다.첫째, 딥시크 V4 출시와 97% 가격 인하 승부수(4/26~27)로 오픈AI GPT-5.5 대비 초저가 경쟁이 점화됐다. AI 모델 가격의 중간층이 붕괴되고, 에이전트 API 비용 경쟁이 전면전으로 확산됐다.[1][2]둘째, GSAT 2026(4/29~30, 창원)이 '피지컬 AI'를 국가 핵심 창업 아젠다로 공식화하며, 제조·조선·방산 분야와 피지컬 AI 스타트업의 산업 연계가 본격 시..

Tech-Trends 2026.04.30

☀️양자화 모델 -노트북용 LLM 추천(26.04)

노트북에 로컬 LLM을 구축 하려 합니다. Ollama를 설치해서 LLM을 설치했는데 너무 느리네요모델의 성능을 유지하고 용량을 줄인 양자화 모델이 필요하여 정리 해 봅니다.☀️로컬 LLM구축을 위한 양자화 모델 -노트북용 LLM 추천(26.04)📔 요약▪︎일반 게이밍 노트북(RTX 4060, 16GB RAM, 8GB VRAM)이라면 양자화된 작은 모델을 추천 합니다.▪︎Qwen 3.5 2B · Llama 7B · Mistral 7B가 8G이하에서 가장 안정적입니다.▪︎12~16GB VRAM 노트북은 Qwen 3.5 4B · Phi-4 14B까지 활용 가능하며,▪︎ 24GB 이상 VRAM 환경에서는 Qwen 3.5 9B · Llama 13B · Mixtral 8x7B 같은 대형 모델도 실행할 ..

BigData 2026.04.28

🚀 AI & Tech 데일리 브리핑 — 2026년 4월 27일

🚀 AI & Tech 데일리 브리핑 — 2026년 4월 27일■ 요약시사점2026년 4월 22~24일 기간, AI 산업 핵심 변화 세 가지가 동시에 드러났다.첫째, 피지컬 AI 투자 가속화다. 국내 페르소나AI가 GPU·인터넷 없이도 동작하는 경량 AI 엔진 기반 휴머노이드 로봇 OS를 공개하며 글로벌 피지컬 AI 시장 선점에 나섰다. NH아문디자산운용은 같은 날 에너지·광통신인프라·반도체 등 5대 투자 테마를 제시하며 피지컬 AI 투자 열풍에 기관까지 가세했다.둘째, 에이전트 인프라 한계 노출이다. 앤스로픽은 클로드 서비스 장애와 이용 폭증에 대응해 월 20달러 프로 요금제에서 '클로드 코드'를 제외하는 실험을 시행했다. 인프라 병목·수익화 전략 재편이 산업 전반 과제임을 보여준다.셋째, 벤치마크 신..

Tech-Trends 2026.04.27

AI플랫폼이 세상의 문명을 바꾸고 있다.

인공지능은 알고리즘 기반의 기술 도구에서 학습 모델로 발전하였고, LLM(대규모 언어 모델)을 기반으로 사용자의 의도와 지식의 바탕을 이해하여 요약과 생성이 가능해졌습니다. 이러한 발전은 단순한 텍스트 생성에서 시작하여, 이제는 다양한 분야에서 활용되고 있습니다. LLM은 자연어 처리(NLP) 분야에서 특히 두드러진 성과를 보이고 있으며, 이는 인공지능의 진화에 큰 기여를 하고 있습니다.1. 인공지능과 LLM의 개념인공지능(AI)은 기계가 인간의 지능을 모방하여 문제를 해결하고 학습하는 기술입니다. LLM은 이러한 인공지능의 한 분야로, 대량의 텍스트 데이터를 학습하여 자연어를 이해하고 생성하는 모델입니다. LLM은 사용자의 질문에 대한 답변을 생성하거나, 주어진 텍스트를 요약하는 등의 작업을 수행할 수..

BigData 2026.04.01

Windows WSL에 Ollama/CUDA 커스텀 경로 설치 가이드(Ubuntu 22.04)

Windows WSL에 Ollama 설치의 장점 WSL2는 NVIDIA GPU와 CUDA Toolkit을 직접 지원하므로, Ollama를 GPU 기반으로 실행 가능 Windows에서 개발하면서도 Linux 기반 AI 툴체인을 그대로 사용할 수 있음.예: VS Code(Windows) + Ollama(WSL) + CUDA(GPU) 조합으로 완전한 AI 개발 환경 구성. WSL 사용법 – How To Start WSL 1WSL 설치와 사용법(Windows Subsystem for Linux) 2알면 좋은 WSL 기본 명령 사용법 3WSL 설치 디렉토리 커스텀 경로 변경 4WSL ssh 설치와 접속하기 5WSL Docker 설치하기 6WSL Ubuntu apt update 오류..

InfraPlatform 2026.01.06

YugabyteDB를 이용한 Claude Desktop MCP 서버 설치

YugabyteDB를 이용한 Claude Desktop MCP 서버 설치MCP란?MCP(Model Context Protocol)는 대규모 언어 모델(LLM)이 일관되고 표준화된 방식으로 기존 엔터프라이즈 서비스와 상호 작용할 수 있도록 하는 새로운 표준입니다. 즉) MCP 서버는 AI가 외부 시스템과 연결되도록 커스텀 API 통합 할 수 있는 표준 인터페이스 입니다. MCP 서버로 LLM(예: Claude)이 자연어로 YugabyteDB에 직접 접근하고 데이터를 분석할 수 있도록 해주는 Python 기반 경량 서버를 구성 할 수 있습니다 yugabyte.com. ⚙️ MCP의 필요성개발자 : MCP는 AI 애플리케이션이나 에이전트를 구축하거나 통합할 때 개발 시간과 복잡성을 줄여줍니다.AI 애플리케..

BigData 2025.10.14

Llama-2 install locally - Llama-2 로컬 사용

Llama-2 install locally - Llama-2 로컬 사용 LLama.cpp를 다운 받아 Llama-2를 테스트 하는 방법을 정리해 봅니다. [ Llama-2 working locally ] llama-2를 실행하는 과정을 다음과 같은 스크립트로 작성을 했습니다. (적합한 시스템 환경에서는 순차적으로 실행이 되겠으나 일부 패키지, 컴파일 환경 등은 하나씩 확인이 필요합니다.) # vi get_llmacpp.sh # -------------------------- #!/bin/bash # ****************************** # 1st Step : llama.cpp download & compile # ****************************** if [ ! -d ..

BigData 2024.02.09

[생성형AI] RAG(Retrieval Augmented Generation)에 대한 초보자 가이드

[생성형AI] RAG(Retrieval Augmented Generation)에 대한 초보자 가이드 RAG(Retrieval Augmented Generation)란 무일까요? 검색 증강 생성은 사전 학습된 대규모 언어 모델(예: 상호 작용 중인 모델)의 기능을 외부 검색 또는 검색 메커니즘과 결합하는 방법입니다. 이 아이디어는 생성 프로세스 중에 외부의 방대한 문서 모음에서 정보를 가져올 수 있도록 하여 생성 모델의 기능을 향상시키는 것입니다. 검색 증강 RAG 생성AI의 장점 RAG에는 몇 가지 놀라운 장점이 있습니다. 1. 지식 확장성 모든 정보를 저장하고 응답 하는 모놀리식 모델 대신 RAG 모델은 외부 데이터베이스를 업데이트하거나 다양한 지식을 확대하는 것만으로 확장이 가능합니다. 2. 메모리 ..

BigData 2023.12.14

(기술)인공지능과 빅데이터 분석을 위한 고성능 분산DBMS SingleStoreDB

(기술)인공지능과 빅데이터 분석을 위한 고성능 분산DBMS SingleStoreDB 빅데이터와 인공지능의 보편화 최근 빅데이터와 인공지능으로 데이터 수집과 관리 기술을 많은 기업에서 사용할 만큼 보편화 되어 있습니다. 그러나 방대하고 다양한 데이터를 처리하기 위해서 도입되는 오픈소스 기반의 데이터 기술들은 데이터 엔지니어, 데이터 사이언티스트등과 같은 고급 기술인력들을 요구하고 있습니다. 이러한 기술 인력은 부족하고 관련 기술의 난이도가 높을 수록 데이터를 관리하고 생산하는 Cost가 실제 데이터를 활용한 서비스를 만드는데 커다란 장벽으로 인식 될 수 있습니다. 앞으로 기술의 발전속도 만큼 더 빠르고 방대한 데이터들이 생겨 날 수록 데이터 기술은 더욱 효율화가 필요하고 더 간단하게 데이터를 활용하는 접근..

BigData 2023.11.19

(AI프롬프트) LangChain과 LLM (Large Language Model)이 만드는 생성형 AI(Generative AI)

프롬프트엔지니어링ChatGPT로 인해 인공지능의 영역은 사용자가 모델에게 제공하는 프롬프트 (입력 문장 또는 질문)를 통해 모델의 출력을 조작하고 원하는 결과를 얻는 AI 프롬프트 또는 프롬프트 엔지니어링의 방법에 이르렀습니다. 방대한 자료를 학습하여 탄생한  LLM(Large Language Model)으로 자연어의 이해, 기계 번역, 텍스트 생성, 질문 응답 및 다양한 언어 관련 작업에서 "인간 수준의 언어 이해와 생성 능력을 갖춘 모델"로서 활용 되고 있습니다.  LangChain(랭체인)은! LangChain은 언어 모델을 기반으로 하는 GPT기반 AI 애플리케이션을 개발하기 위한 프레임워크입니다.  LangChain을 이용해서 chatGPT의 API와 연계하여  LLM을 기반으로한 다양한 언어 ..

BigData 2023.11.07
728x90
반응형