728x90
반응형

BigData 88

빅테크가 이끄는 인공지능 LLM 기술 동향 - GPT-4.5, Claude 3.7 Sonnet, Gemini 2.5 Pro, DeepSeek

빅테크가 이끄는 인공지능 대규모언어모델 LLM 기술 동향대규모 언어 모델(LLM) 기술 동향: GPT-4.5, Claude 3.7 Sonnet, Gemini 2.5 Pro, 그리고 DeepSeek 비교GPT-4.5, Claude 3.7 Sonnet, Gemini 2.5 Pro, DeepSeek 모델의 특징과 차이점GPT-4.5업체명: Open AI개발년도: 2025년 2월주요 특징: 1T 이상의 파라미터를 가지는 것으로 추정되며, 텍스트와 이미지를 멀티모달로 지원하고 강력한 논리적 추론 능력을 갖추고 있습니다. 빠른 결과 도출을 중시하며 효율적인 추론 구조를 가지고 있습니다.주요 활용 분야: 일반 자연어 처리(NLP) 및 코딩, 문서 자동화, 검색 증강 생성(RAG) 연계에 최적화되어 기업용 워크플로우 ..

BigData 2025.05.21

데이터베이스 튜닝 및 메모리 관리 (PostgreSQL YugabyteDB MySQL SingleStore )

데이터베이스 튜닝 및 메모리 관리 (PostgreSQL YugabyteDB MySQL SingleStore ) 각 데이터베이스 시스템의 논리 데이터베이스 튜닝 및 메모리 관리 튜닝 방법 * 주요 DB 설정 리소스 관리 튜닝 파라미터 비교 *PostgreSQL → YugabyteDB → MySQL → SingleStore 🔹 논리 데이터베이스 튜닝 비교DBMS쿼리 최적화인덱스 관리분산 처리캐싱 전략PostgreSQLpg_stat_statements, EXPLAIN ANALYZEbtree, hash, GIN, BRIN 인덱스 지원기본적으로 단일 노드 운영shared_buffers, effective_cache_size 활용YugabyteDBpg_stat_statements 활용, EXPLAIN ANALY..

BigData 2025.05.21

Cloud Native Database 와 기존 RDB비교- 큐브리드(CUBRID), 오라클(Oracle), MySQL, PostgreSQL, YugabyteDB등

Cloud Native Database 와 기존 RDB비교큐브리드(CUBRID), 오라클(Oracle), MySQL, PostgreSQL, YugabyteDB등 각 DBMS의 주요 기능을 비교 큐브리드 (CUBRID): 대한민국 전자정부 표준 DBMS로 공공기관에서 많이 사용됨. 오픈소스이며 샤딩 기능을 지원. 트랜잭션 및 성능 최적화에 강점.오라클 (Oracle): 기업 및 금융기관에서 널리 사용되는 상용 DBMS. 강력한 보안, 고성능, 파티셔닝 지원. 높은 확장성과 안정성을 제공하지만 비용이 높음.MySQL: 가볍고 빠른 오픈소스 DBMS로 웹 애플리케이션에서 많이 활용됨. 쉬운 설치와 사용이 가능하며, 기본적인 트랜잭션 처리 기능을 갖춤.PostgreSQL: 고급 기능을 갖춘 오픈소스 DBMS로..

BigData 2025.05.20

대규모 언어 모델(LLM) 기술 동향 - GPT-4.5, Claude 3.7 Sonnet, Gemini 2.5 Pro

대규모 언어 모델(LLM) 기술 동향 : GPT-4.5, Claude 3.7 Sonnet, Gemini 2.5 Pro 현황 최근 25년 동안 출시된 주요 대규모 언어 모델(LLM)을 정리하고, 각 모델과 기존 GPT-4의 기능적, 기술적 특징을 비교해 보겠습니다. 1. 주요 LLM 출시 현황 (2000~2025)지난 25년 동안 LLM 기술은 급격히 발전했습니다. 아래는 주요 모델들의 출시 연도와 특징을 정리한 표입니다.출시 연도모델주요 특징2000~2010초기 신경망 기반 모델제한적인 NLP 기능, 규칙 기반 번역2017GPT-1최초의 트랜스포머 기반 모델, 117M 파라미터2019GPT-21.5B 파라미터, 더 자연스러운 텍스트 생성2020GPT-3175B 파라미터, Few-shot Learni..

BigData 2025.05.13

GPT-3 GPT-4와 GPT-5의 뭐가 좋아지나?

GPT-5 GPT-5는 2025년 중반 출시가 예상되며, OpenAI는 이를 통해 AI 기술을 한 단계 더 발전하고 있습니다. OpenAI는 GPT-5를 통해 AGI(인공지능 일반)로의 도약을 목표로 하고 있으며, 개인화된 사용자 경험, 오류 감소, 그리고 더 자연스러운 대화 능력을 강화하고 훨씬 더 강력한 고급 추론 기능과 다중 모드 기능을 단일 시스템으로 통합할 것으로 예상 됩니다.AGI(Artificial General Intelligence, 인공 일반 지능)는 인간의 지능을 전반적으로 모방하는 AI를 의미해요. - 기존 AI(ANI, 특정 목적 AI)는 특정 작업만 수행 했다면 - AGI는 다양한 문제를 해결하고 학습하며 창의적으로 사고할 수 있는 능력- AGI가 현실화된다면, 기계가 인간과 동..

BigData 2025.05.09

MySQL Slave의 Replication 복제 지연 속도 개선팁

MySQL의 Slave Lag(복제 지연) 문제와 Replication 동기화 성능 개선에 대한 내용을 정리해볼게요.🕰 MySQL Slave Lag (복제 지연)MySQL의 레플리케이션(replication) 환경에서 Slave가 Master로부터 변경 사항을 받아 적용하는 과정에서 지연(lag)이 발생할 수 있어요. 주요 원인은 다음과 같습니다:네트워크 지연Master와 Slave 간의 데이터 전송 속도가 느려서 발생하는 문제특히 WAN 환경에서는 네트워크 레이턴시가 높아지면 복제 지연이 심화쿼리 실행 속도 차이Master에서 실행된 쿼리가 Slave에서도 동일하게 실행되는데, Slave의 성능이 낮으면 적용 속도가 느려지며 지연 발생복잡한 UPDATE나 DELETE 문이 많을 경우 Slave의 부하..

BigData 2025.04.23

YugabyteDB의 트랜잭션 디자인이 다른 데이터베이스와 비교했을 때 독특한 점

YugabyteDB는YugabyteDB는 PostgreSQL과 호환되는 고성능 클라우드 네이티브 분산 SQL 데이터베이스입니다. 기존 관계형 데이터베이스의 이점과 NoSQL 시스템의 확장성을 결합하여 트랜잭션 일관성과 대용량 데이터 처리 능력이 모두 필요한 애플리케이션에 적합합니다. 절대적인 데이터 정확성을 요구하고 확장성, 높은 장애 내성, 또는 전 세계적으로 분산된 배포 중 하나 이상을 필요로 하는 클라우드 네이티브 OLTP(즉, 실시간 비즈니스 크리티컬) 애플리케이션에 가장 적합합니다. YugabyteDB의 트랜잭션 디자인을 독특하게 만드는 이유구글 스패너에서 영감을 받은 분산형 ACID 거래YugabyteDB의 트랜잭션 모델은 Google Spanner의 아키텍처를 기반으로 하며, 여러 샤드와 ..

BigData 2025.04.21

YugabyteDB가 멀티마스터 복제를 처리하는 방법

YugabyteDB가 멀티마스터 복제를 처리하는 방법 YugabyteDB가 멀티 마스터 복제를 처리하는 방법YugabyteDB는 서로 다른 지역에서 독립적인 클러스터를 실행하여 멀티마스터(액티브-액티브) 복제를 구현합니다. 각 클러스터는 로컬 읽기와 쓰기를 처리할 수 있습니다. 데이터는 xCluster 복제를 사용하여 클러스터 간에 비동기적으로 복제됩니다[1][2][3].복제 모드: 클러스터 간의 복제는 비동기식이므로 데이터 변경이 지역 간에 즉시 보이지 않습니다. 이는 낮은 지연 시간의 로컬 작업을 보장하지만 궁극적인 일관성을 제공합니다[1][2].충돌 해결: 동일한 데이터가 복제되기 전에 여러 클러스터에서 업데이트될 경우, "마지막 작성자가 승리" 전략을 사용하여 충돌을 해결합니다. 이 전략에서는 마..

BigData 2025.04.21

LLM의 종류와 특징 비교

LLM의 종류와 특징 비교 주요 LLM 종류 와 특징 모델명 대표 버전/용량 성능/기능 특징 오픈소스 여부 지원 환경 확장 기능/특이점 GPT 시리즈 (OpenAI)GPT-3 (175B), GPT-4, GPT-4o 등텍스트 생성, 고급 추론, 코드 작성, 멀티모달(GPT-4o) 등. 최신 버전일수록 정확도와 멀티모달 처리 능력 향상[2][4][7]비공개(상업 API)클라우드(웹, API), MS Copilot 등플러그인, 인터넷 액세스, 코드 해석, 이미지 처리 등[12]Gemini (Google)Gemini 1.5 등멀티모달(텍스트+이미지) 강점, 구글 생태계 연동, 빠른 응답 속도[5][7]비공개(상업 API)클라우드(Google Workspace 등)구글 서비스와 통합, 이미..

BigData 2025.04.18

AWS 지원 데이터베이스 종류와 특징

데이터베이스: • Amazon Aurora • Amazon DocumentDB(MongoDB 호환) • Amazon DynamoDB • Amazon DynamoDB Accelerator(DAX) • Amazon ElastiCache • Amazon Keyspaces(for Apache Cassandra) • Amazon Neptune • Amazon Quantum Ledger Database(Amazon QLDB) • Amazon RDS • Amazon Redshift • Amazon Timestream AWS 지원 데이터베이스 종류와 특징AWS 지원 데이터베이스 종류: • Amazon Aurora • Amazon DocumentDB(MongoDB 호환) • Amazon DynamoDB • Amazon ..

BigData 2025.04.15

MYSQL에서 제공하는 Vector Data 처리기능

MYSQL에서 제공하는 Vector Data 처리기능MySQL은 벡터 데이터 처리 기능을 내장하여 AI 기반 애플리케이션 개발을 지원합니다. 아래는 주요 기능과 사용 예시, 기존 벡터 DB 대비 장점을 정리한 내용입니다.  MySQL의 Vector DB 기능1. 벡터 데이터 타입 지원VECTOR(n): n차원 벡터 저장 가능 (예: VECTOR(768))[2][5].저장 방식: VARBINARY 또는 리스트 형식 문자열로 4바이트 부동소수점 저장[2].크기 제한: 2048~16383 차원 지원 (기본값 2048)[2]. 2. 벡터 변환 함수STRING_TO_VECTOR(): 문자열을 벡터로 변환 (예: '[1][2][3]' → 이진값)[2][5].VECTOR_TO_STRING(): 이진 벡터를 문자열로 ..

BigData 2025.04.02

Mysql - AI 구현을 위한 Vector data 처리하기

#Mysql - AI 구현을 위한 Vector data 처리하기#MySQL은 벡터 데이터 처리 기능을 내장하여 AI 기반 애플리케이션 개발을 지원합니다.아래는 주요 기능과 사용 예시, 기존 벡터 DB 대비 장점을 정리한 내용입니다.  MySQL의 Vector DB 기능 1. 벡터 데이터 타입 지원VECTOR(n): n차원 벡터 저장 가능 (예: VECTOR(768))[2][5].저장 방식: VARBINARY 또는 리스트 형식 문자열로 4바이트 부동소수점 저장[2].크기 제한: 2048~16383 차원 지원 (기본값 2048)[2]. 2. 벡터 변환 함수STRING_TO_VECTOR(): 문자열을 벡터로 변환 (예: '[1][2][3]' → 이진값)[2][5].VECTOR_TO_STRING(): 이진 벡터..

BigData 2025.04.02

인공지능GPT - LLM, sLLM, 그리고 SLM의 특징 비교

LLM (Large Language Model) , sLLM (specialized/small LLM) , 그리고 SLM (Small Language Model) 비교LLM, sLLM, 그리고 SLM은 각각 언어 모델의 크기와 목적에 따라 설계된 자연어 처리 기술입니다. LLM (Large Language Model)특징:대규모 텍스트 데이터를 기반으로 학습된 모델로, 수십억~수천억 개의 파라미터를 포함합니다.다양한 분야와 주제를 처리할 수 있는 범용성을 가지고 있습니다.클라우드 기반 서비스로 제공되며, API 호출 방식으로 사용됩니다.대표 사례: GPT-4 (OpenAI), Gemini (Google), Claude (Anthropic), LLaMA 2 (Meta).장점: 방대한 지식과 추론 능력.단점..

BigData 2025.03.29

10가지 유용한Text 데이터 분석 라이브러리

#Gensim #spaCy #NLTK #TextBlob #PyCaret #Word2Vec #Doc2Vec10가지 유용한Text 데이터 분석 라이브러리 데이터 분석을 위한 기술로 텍스트 분석 및 자연어 처리 도구들과 기법들을 설명하고 비교해봅니다.1. Gensim목적: 토픽 모델링, 문서와 단어 임베딩, 그리고 자연어 처리(NLP)를 위한 Python 라이브러리.주요 기능:LDA, Word2Vec, Doc2Vec, FastText와 같은 알고리즘 지원.대규모 텍스트 데이터를 효과적으로 처리.특징:간단한 사용법과 확장성이 뛰어남.텍스트 클러스터링 및 토픽 모델링에 강점.https://linkniti1.com/2. spaCy목적: 고성능의 자연어 처리(NLP)를 제공하는 Python 라이브러리.주요 기능:토큰..

BigData 2025.03.28

Gram이란 N-gram과 skip-gram

N-gram과 skip-gram은 자연어 처리(NLP)에서 텍스트 데이터를 분석하거나 학습할 때 사용하는 대표적인 방법입니다. N-gram정의: N-gram은 텍스트를 연속된 N개의 단위로 분할하여 분석하는 기법입니다. 여기서 N은 1, 2, 3 등 원하는 크기를 나타냅니다.Unigram: 단일 단어로 분할 (N=1)Bigram: 두 단어씩 묶음 (N=2)Trigram: 세 단어씩 묶음 (N=3)작동 방식:주어진 텍스트를 입력받습니다.텍스트를 N개의 연속된 단어, 글자 등의 단위로 나눕니다.각 N-gram의 빈도나 확률 분포를 계산하여 분석에 활용합니다.주요 활용:문장 유사도 비교언어 모델링텍스트 분류 및 감정 분석예시:"I love AI"라는 문장이 있을 때:Unigram: ["I", "love", "..

BigData 2025.03.26

인공지능 기술 - 기술 요소의 진화와 서비스 동향 정리 2025.3.21

인공지능 기술 요소 및 서비스 동향 정리인공지능 기술은 다양한 형태의 데이터를 처리하고 분석하는 데 사용되며, 각 데이터 유형에 특화된 기술 요소들이 존재합니다.인공지능 기술은 GPT가 나오기전과 나오고 난 이후 시장은 급속한 변화가 일어나고 있습니다.기존의 TEXT, DATA를 중심으로 예측하고 분류하고 분석하는 기술에서 비정형 이미지, 동영상을 생성하거나, 사람과의 대화, 지식의 검색증강 등을 통해 사람과의 상호작용이 증가하는 추세로 보여 집니다.앞으로 인공지능은 사람의 지능을 증강하고 역량을 강화하는 도구로서 지식을 수준으로 역량을 측정하는 시대는 사라질 지도 모릅니다. 오히려 사람의 본성과 인간미 넘치는 판단이 더 중요한 사회가 되기를 바랍니다.최근 인공지능 CEO, 인공지능 면접관 등 사람을 평..

BigData 2025.03.23

Graph RAG - RAG 모델보다 더 정확한가

#Graph RAG가 기존 RAG 모델보다 더 정확한 이유는Graph RAG가 기존 RAG 모델보다 더 정확한 이유  1. RAG와 Graph RAG 데이터 구조의 차이기존 RAG는 주로 벡터 임베딩(Vector Embedding)을 사용하여 정보를 검색합니다. 이는 문서나 데이터를 고차원 벡터로 변환한 뒤, 사용자의 질문도 벡터화하여 벡터 공간에서 가장 유사한 항목을 검색하는 방식입니다.Graph RAG는 그래프 데이터 구조를 활용합니다. 그래프는 노드와 엣지로 구성되며, 데이터 간의 관계를 명시적으로 표현할 수 있습니다. 이를 통해 데이터 간의 연결성과 맥락을 더 잘 이해할 수 있습니다.  2. 검색 정확도벡터 기반 RAG 검색은 데이터의 유사도를 계산하는 데 효과적이지만, 문맥이나 관계를 충분히 반..

BigData 2025.03.13

GraphRAG(그래프 기반 검색-증강 생성) 파이프라인을 구축하는 방법

GraphRAG(그래프 기반 검색-증강 생성) 파이프라인을 구축하는 방법 아래는 GraphRAG(그래프 기반 검색-증강 생성) 파이프라인 구축 방법을 구체적으로 실행 가능하도록 정리한 내용입니다. 각 단계별로 필요한 코드를 포함하여 설명합니다.1. 환경 설정먼저, Python 환경을 설정하고 필요한 라이브러리를 설치합니다.Python(3.7 이상)과 pip 설치.가상 환경 생성:python -m venv myenv source myenv/bin/activate # Windows: myenv\Scripts\activate필요한 라이브러리 설치:pip install llama-index graspologic numpy scipy neo4j-graphrag 가상 환경 생성 및 활성화python -m venv ..

BigData 2025.03.11

Graph RAG의 주요 특징

Graph RAG의 주요 특징지식 그래프 활용:텍스트에서 엔티티와 관계를 추출하여 지식 그래프를 생성하고 이를 기반으로 정보를 검색 및 생성.노드(개체)와 엣지(관계)를 통해 데이터 간의 복잡한 연결성을 명확히 표현정보 간 관계 이해:검색된 정보들 간의 관계를 그래프 구조로 모델링하여 맥락과 상호작용을 더 깊이 이해이를 통해 더욱 일관성 있고 논리적인 텍스트 생성 가능효율적인 데이터 처리:대규모 데이터셋에서도 계층적 클러스터링과 그래프 순회를 통해 효율적으로 정보를 검색하고 처리복잡한 데이터 간 연결성을 유지하며 정확한 답변 제공추론 능력 강화:정보 간 관계를 기반으로 새로운 결론 도출 가능, 단순 검색 이상의 고차원적 질문 응답 성능 제공유연성과 확장성:다양한 데이터 구조와 관계를 처리할 수 있어 복잡..

BigData 2025.03.11

[인공지능] Meta AI LLaMA 모델을 사용하여 주식 예측 프로그램 만들기

[인공지능] Meta AI LLaMA 모델을 사용하여 주식 예측 프로그램 만들기 Meta AI (Facebook)의 LLaMA 모델을 사용하여 주식 예측 프로그램을 작성하는 방법을 소개하겠습니다.LLaMA 모델은 Meta에서 개발한 대규모 언어 모델로, 다양한 자연어 처리 작업에 활용될 수 있습니다. 주식 예측 프로그램을 작성하기 위해서는 주식 데이터를 가져오고, 이를 LLaMA 모델에 입력하여 예측을 수행하는 과정을 포함합니다.다음은 Python을 사용하여 LLaMA 모델을 활용한 주식 예측 프로그램의 예제 코드입니다:import yfinance as yfimport matplotlib.pyplot as pltimport torchfrom transformers import LlamaForCausalL..

BigData 2025.02.23
728x90
반응형