728x90
반응형

BigData 72

Graph RAG - RAG 모델보다 더 정확한가

#Graph RAG가 기존 RAG 모델보다 더 정확한 이유는Graph RAG가 기존 RAG 모델보다 더 정확한 이유  1. RAG와 Graph RAG 데이터 구조의 차이기존 RAG는 주로 벡터 임베딩(Vector Embedding)을 사용하여 정보를 검색합니다. 이는 문서나 데이터를 고차원 벡터로 변환한 뒤, 사용자의 질문도 벡터화하여 벡터 공간에서 가장 유사한 항목을 검색하는 방식입니다.Graph RAG는 그래프 데이터 구조를 활용합니다. 그래프는 노드와 엣지로 구성되며, 데이터 간의 관계를 명시적으로 표현할 수 있습니다. 이를 통해 데이터 간의 연결성과 맥락을 더 잘 이해할 수 있습니다.  2. 검색 정확도벡터 기반 RAG 검색은 데이터의 유사도를 계산하는 데 효과적이지만, 문맥이나 관계를 충분히 반..

BigData 2025.03.13

GraphRAG(그래프 기반 검색-증강 생성) 파이프라인을 구축하는 방법

GraphRAG(그래프 기반 검색-증강 생성) 파이프라인을 구축하는 방법 아래는 GraphRAG(그래프 기반 검색-증강 생성) 파이프라인 구축 방법을 구체적으로 실행 가능하도록 정리한 내용입니다. 각 단계별로 필요한 코드를 포함하여 설명합니다.1. 환경 설정먼저, Python 환경을 설정하고 필요한 라이브러리를 설치합니다.Python(3.7 이상)과 pip 설치.가상 환경 생성:python -m venv myenv source myenv/bin/activate # Windows: myenv\Scripts\activate필요한 라이브러리 설치:pip install llama-index graspologic numpy scipy neo4j-graphrag 가상 환경 생성 및 활성화python -m venv ..

BigData 2025.03.11

Graph RAG의 주요 특징

Graph RAG의 주요 특징지식 그래프 활용:텍스트에서 엔티티와 관계를 추출하여 지식 그래프를 생성하고 이를 기반으로 정보를 검색 및 생성.노드(개체)와 엣지(관계)를 통해 데이터 간의 복잡한 연결성을 명확히 표현정보 간 관계 이해:검색된 정보들 간의 관계를 그래프 구조로 모델링하여 맥락과 상호작용을 더 깊이 이해이를 통해 더욱 일관성 있고 논리적인 텍스트 생성 가능효율적인 데이터 처리:대규모 데이터셋에서도 계층적 클러스터링과 그래프 순회를 통해 효율적으로 정보를 검색하고 처리복잡한 데이터 간 연결성을 유지하며 정확한 답변 제공추론 능력 강화:정보 간 관계를 기반으로 새로운 결론 도출 가능, 단순 검색 이상의 고차원적 질문 응답 성능 제공유연성과 확장성:다양한 데이터 구조와 관계를 처리할 수 있어 복잡..

BigData 2025.03.11

[인공지능] Meta AI LLaMA 모델을 사용하여 주식 예측 프로그램 만들기

[인공지능] Meta AI LLaMA 모델을 사용하여 주식 예측 프로그램 만들기 Meta AI (Facebook)의 LLaMA 모델을 사용하여 주식 예측 프로그램을 작성하는 방법을 소개하겠습니다.LLaMA 모델은 Meta에서 개발한 대규모 언어 모델로, 다양한 자연어 처리 작업에 활용될 수 있습니다. 주식 예측 프로그램을 작성하기 위해서는 주식 데이터를 가져오고, 이를 LLaMA 모델에 입력하여 예측을 수행하는 과정을 포함합니다.다음은 Python을 사용하여 LLaMA 모델을 활용한 주식 예측 프로그램의 예제 코드입니다:import yfinance as yfimport matplotlib.pyplot as pltimport torchfrom transformers import LlamaForCausalL..

BigData 2025.02.23

[인공지능 RAG 주식 예측] 간단하게 GPT LLM을 이용한 주식 예측 프로그램 만들기

[인공지능 RAG 주식 예측] 간단하게 GPT LLM을  이용한 주식 예측 프로그램 만들기 제목이 어려워 보여서 간단히 설명 드리고 프로그램으로 정리해 보겠습니다.ㅁ GPT는 "생성형 AI 모델" 세상의 모든 디지털 데이터들을 학습하여 만든 인공지능모델로 답변을 생성하는 기술! GPT, 또는 "Generative Pre-trained Transformer"는 OpenAI에서 개발한 인공지능 모델입니다. 이 모델은 자연어 처리 작업을 수행하는 데 매우 유용하며, 텍스트 생성, 번역, 대화 및 질문 응답 등의 다양한 응용 프로그램에 사용될 수 있습니다.간단히 정리하면 GPT는 우리가 알고있는 인터넷 검색에서 사용하는 모든 데이터 뿐아니라,  일반적인 출판서적, 위키백과, 브리테니커 같은 백과사전들, 인터넷에..

BigData 2025.02.22

인공지능 주식 예측에 적합한 분석 알고리즘의 종류

인공지능 주식 예측에 적합한 분석 알고리즘의 종류 소개  각 알고리즘은 특정 유형의 데이터를 처리하거나 테이블의 예상 성능에서 다릅니다. 단일 알고리즘에 의존하지 말고, 여러 알리즘을 시도하여 최적의 모델을 찾는 것이 중요합니다. 1. LSTM (Long Short-Term Memory)LSTM은 순환 신경망 (RNN,Recurrent Neural Network) 계통의 알고리즘으로, 시계열 데이터의 장기 의존성을 처리하는 데 강력합니다. 장점: 과거 데이터의 순서 정보 유지, 장기 의존성 문제 해결단점: 많은 데이터 필요, 훈련 시간 길어질 수 있음 정확도 특징: 데이터의 패턴을 잘 포착하여 높은 정확성을 보일 수 있으나, 데이터 크기와 모델 구성에 따라 성능이 달라질 수 있습니다 # LSTM 모델 예..

BigData 2025.01.16

Install SingleStore on Docker : Desktop

Install  SingleStore on Docker : Desktop This guide will install a preconfigured docker image that contains a simple one node ㅁ  SingleStore DB 설치하는 과정을 정리하여 봅니다.1. https://www.singlestore.com/       - singlestore 사이트에 접속하여 본문의 "Start Free" 버튼을 선택 합니다.   2.  회원 가입 및 로그인을 합니다.  3. SingleStore 사용자 포탈에 접속 합니다.      -  https://portal.singlestore.com/          (1)   아래  우측 상단의 "ORGANIZATION" 을 선택 합니다..

BigData 2025.01.14

[인공지능 기술] LlamaIndex와 ChatGPT 사용하기 - llama-index

[인공지능 기술] LlamaIndex와 ChatGPT 사용하기 - llama-index ChatGPT는 방대한 학습 데이터(LLM)를 이용하여 번역, 요약, 설명 등을 할 수 있는 기술이지만 최신의 정보나 특정 도메인의 지식을 설명하지 못하는 경우 RAG( Retrieval Augmented Generation) 방식으로 데이터의 증강이 필요합니다.LlamaIndex와 ChatGPT를 사용하여 다양한 도메인에 맞게 고급 애플리케이션을 생성할 수 있습니다. ChatGPT에서 학습되지 않은 이용하여 외부의 데이터를 임베딩하여 검색에 필요한 도메인별 Data를 추가하여 ChatGPT를 이용 할수 있습니다.이와 같은 방식을 RAG 기술라고 하며 기업은 제품 관련 질문에 대답할 수 있는 강력한 대화형 챗봇을 ..

BigData 2024.12.12

How to add Firewall rules on Redhat 9 - Allow MySQL Service Through the Firewall

How to add Firewall rules on Redhat 9 - Allow MySQL Service Through the FirewallTo add MySQL (mysqld) to your firewall rules on Red Hat 9, you can follow these steps: Linux 9 서버에서는 기존에 사용하는 'iptables'  대신 firewall을 이용하여 서비스 접근 제어를 기본으로 하고 있습니다.새로 설치한 mysql 서비스가 접근이 안되는 부분을 여러번 하다가 찾은 내용이 Firewalld 입니다.Firewalld이 적용 되었을 것이라고 예상을 하기는 했지만 역시 세월이 바뀌는 만큼 바뀐것이 있습니다.* 예전에는 iptables 기반의 firewall 이어서 ipt..

BigData 2024.10.03

MYSQL 계정 생성, 권한부여, 권한 삭제

MYSQL  계정 생성, 권한부여, 권한 삭제  1.사용자계정 생성 (mysql create user)    mysql> create user 'userid'@'%'  IDENTIFIED BY 'userpasswd';  mysql> CREATE USER 'userid'@'192.168.%' IDENTIFIED BY 'user_password';Query OK, 0 rows affected (0.04 sec)mysql> flush privileges;Query OK, 0 rows affected (0.03 sec)mysql> ALTER USER 'userid'@'localhost' IDENTIFIED BY 'user_password';-- 변경된 패스워드를 시스템 환경에 적용 하려면 아래 명령이 필요합니다..

BigData 2024.10.03

[인공지능] ARIMA -주가 예측 모델: 3-6-9개월 후 AMZN 주가 확인 -

[인공지능] ARIMA -주가 예측 모델 : 3-6-9개월 후 "AMZN" 주가는 어떻게 될까요  인터넷 검색 도구를 사용하여 아마존 주식의 과거 데이터를 수집하고 모델을 학습하여 주식을 예측 라는 방법입니다.1. 데이터 수집아마존 주식의 과거 데이터를 수집하기 위해 다음과 같은 웹사이트를 사용할 수 있습니다:Yahoo Finance: Yahoo Finance - AmazonGoogle Finance: Google Finance - AmazonBloomberg: Bloomberg - Amazon이 웹사이트에서 데이터를 CSV 파일로 다운로드할 수 있습니다.. 먼저, Yahoo Finance에서 아마존 주식 데이터를 CSV 파일 형식으로 다운로드합니다.. Yahoo Finance - Amazon로 이동합니..

BigData 2024.08.12

[GPT기술] Llama2 AI모델을 이용한 검색 기술에 활용하기

Llama2 는 누구나 무료로 다운로드하여 사용할 수 있는 대규모 오픈 소스 언어 모델입니다.자율주행차부터 챗봇까지,  AI혁명으로 사회 전반의 삶의 변화가 일어나고 있습니다.  AI의 가장 흥미로운 발전 중 하나는 대규모 언어 모델의 생성입니다. 이러한 모델은 일관되고 이해하기 쉬운 새로운 텍스트를 생성하기 위해 기사 및 소셜 미디어 게시물과 같은 대량의 데이터에 대해 훈련되었습니다. 대규모 언어 모델의 잘 알려진 예로는 OpenAI의 ChatGPT, Google의 Google Bard, Meta의 Llama 2가 있습니다. Meta는 Microsoft와 협력하여 Lama 2 모델을 출시했습니다. Llama2 AI모델에 대한 소개 Llama 2는 페이스북 모회사 메타의 AI 그룹에서 개발한 대규모 언어..

BigData 2024.05.22

[인공지능 기술] RAG를 위한 라마인덱스의 정리 - llamaindex 의 특징

[인공지능 기술] RAG를 위한 라마인덱스의 정리 - llamaindex 의 특징 라마인덱스(LlamaIndex)와 ChatGPT라마인덱스(LlamaIndex)는 RAG(Retrieval Augmented Generation)을 구현할 때 유용한 프레임워크입니다.ChatGPT는 방대한 학습된 데이터(LLM)를 이용하여  번역, 요약, 설명 등을 할 수 있는 기술이지만 최신의 정보나 특정 도메인의 지식을 설명하지 못하는 경우 RAG( Retrieval Augmented Generation) 방식으로 데이터의 증강이 필요합니다.이 경우 라마인덱스를 이용하여  ChatGPT가 새로운 도메인의 데이터를 검색하고 응답할수 있도록 데이터를 벡터화 하는 임베딩의 과정을 거쳐 데이터를 활용 할 수 있습니다. RAG(R..

BigData 2024.05.12

Llama-2 local 설치 - install gobjc gcc-objc - LLma.cpp 컴파일러 설치

1. Llama-2 local 설치 - install gobjc gcc-objc - 컴파일러 설치 2. Llama-2 local 설치 할 때 생기는 문제들 - llama.cpp해결 **라마 2 (LLama 2)**는 **메타(Meta,페이스북)**에서 개발한 오픈소스 대규모 언어 모델(LLM large language model, GPT)입니다. 이 모델은 최대 70B 규모의 매개변수를 지원하며, GPT-3.5와 동등한 성능을 낸다고 합니다. 라마 2는 누구나 무료로 사용할 수 있으면서, 소스 코드가 공개된 오픈소스라는 것이 큰 장점을 가지고 있습니다. 또한 라마 1 보다 라마 2는 40% 더 많은 데이터를 학습하고, 콘텍스트는 2배가 많아서 추론, 코딩 숙련도, 지식 테스트 등 모든 지표에서 다른 Op..

BigData 2024.02.14

Llama-2 install locally - Llama-2 로컬 사용

Llama-2 install locally - Llama-2 로컬 사용 LLama.cpp를 다운 받아 Llama-2를 테스트 하는 방법을 정리해 봅니다. [ Llama-2 working locally ] llama-2를 실행하는 과정을 다음과 같은 스크립트로 작성을 했습니다. (적합한 시스템 환경에서는 순차적으로 실행이 되겠으나 일부 패키지, 컴파일 환경 등은 하나씩 확인이 필요합니다.) # vi get_llmacpp.sh # -------------------------- #!/bin/bash # ****************************** # 1st Step : llama.cpp download & compile # ****************************** if [ ! -d ..

BigData 2024.02.09

Llama-2 local 설치 할 때 생기는 문제들 - llama.cpp해결

1. Llama-2 local 설치 - install gobjc gcc-objc - 컴파일러 설치 2. Llama-2 local 설치 할 때 생기는 문제들 - llama.cpp해결 **라마 2 (LLama 2)**는 **메타(Meta,페이스북)**에서 개발한 오픈소스 대규모 언어 모델입니다. 이 모델은 최대 70B 규모의 매개변수를 지원하며, GPT-3.5와 동등한 성능을 낸다고 합니다. 라마 2는 누구나 무료로 사용할 수 있으면서, 소스 코드가 공개된 오픈소스라는 것이 큰 장점을 가지고 있습니다. 또한 라마 1 보다 라마 2는 40% 더 많은 데이터를 학습하고, 콘텍스트는 2배가 많아서 추론, 코딩 숙련도, 지식 테스트 등 모든 지표에서 다른 Open LLM들 대비 우수한 성능을 낸다고 합니다. Lla..

BigData 2024.02.08

[생성형AI] RAG(Retrieval Augmented Generation)에 대한 초보자 가이드

[생성형AI] RAG(Retrieval Augmented Generation)에 대한 초보자 가이드 RAG(Retrieval Augmented Generation)란 무일까요? 검색 증강 생성은 사전 학습된 대규모 언어 모델(예: 상호 작용 중인 모델)의 기능을 외부 검색 또는 검색 메커니즘과 결합하는 방법입니다. 이 아이디어는 생성 프로세스 중에 외부의 방대한 문서 모음에서 정보를 가져올 수 있도록 하여 생성 모델의 기능을 향상시키는 것입니다. 검색 증강 RAG 생성AI의 장점 RAG에는 몇 가지 놀라운 장점이 있습니다. 1. 지식 확장성 모든 정보를 저장하고 응답 하는 모놀리식 모델 대신 RAG 모델은 외부 데이터베이스를 업데이트하거나 다양한 지식을 확대하는 것만으로 확장이 가능합니다. 2. 메모리 ..

BigData 2023.12.14

SQL 데이터 통계 분석을 강화하는 analytics - window functions

SQL 데이터 통계 분석을 강화하는 analytics functions SQL에서의 윈도우 함수(Analytic Functions)는 데이터를 분석하고 처리하기 위한 강력한 도구를 제공합니다. Oracle은 Analytics Functions라고 하고, Mysql 에서는 Window Function이라고 명명하고 있습니다. Analytic (Window) function와 SQL Standards SQL 언어의 표준 규격은 데이터베이스 관리 시스템(DBMS) 간의 호환성을 증진하기 위해 정의된 것입니다. SQL:2003 버전 이후부터 윈도우 함수가 표준에 추가되었으며, Window 함수와 같은 분석 함수(Analytic Functions)를 지원하고 있습니다. Window 함수는 데이터를 특정 윈도우 또..

BigData 2023.12.05

(기술)인공지능과 빅데이터 분석을 위한 고성능 분산DBMS SingleStoreDB

(기술)인공지능과 빅데이터 분석을 위한 고성능 분산DBMS SingleStoreDB 빅데이터와 인공지능의 보편화 최근 빅데이터와 인공지능으로 데이터 수집과 관리 기술을 많은 기업에서 사용할 만큼 보편화 되어 있습니다. 그러나 방대하고 다양한 데이터를 처리하기 위해서 도입되는 오픈소스 기반의 데이터 기술들은 데이터 엔지니어, 데이터 사이언티스트등과 같은 고급 기술인력들을 요구하고 있습니다. 이러한 기술 인력은 부족하고 관련 기술의 난이도가 높을 수록 데이터를 관리하고 생산하는 Cost가 실제 데이터를 활용한 서비스를 만드는데 커다란 장벽으로 인식 될 수 있습니다. 앞으로 기술의 발전속도 만큼 더 빠르고 방대한 데이터들이 생겨 날 수록 데이터 기술은 더욱 효율화가 필요하고 더 간단하게 데이터를 활용하는 접근..

BigData 2023.11.19

인공지능 GPT4와 RAG를 이해하는데 알아야 하는 용어들

[인공지능 GPT를 이해하는데  알아야 하는 용어들]GPT(Generative Pre-trained Transformer)LangChainLLM (Large Language Model, 거대 언어 모델)Vector Embedding(벡터 임베딩)Vector Database (벡터 데이터베이스)Tokenize (토큰화)사용자가 GPT를 이용하는 과정을 심플하게 이해하기GPT에 대한 내용보다 작동되는 과정을 이해하고  어떻게 하면 만들수 있을까를 고민하면서 업데이트를 하고 있습니다. 조금씩 발전 하는 오늘이 되는데 보탬이 되면 좋겠습니다.GPT3.5의 작동 과정사용자가 GPT를 이용하는 과정을 심플하게 표현하면 질문을 이해하고 학습된 데이터에서 결과를 읽고 답변하는 것입니다.GPT3.5의 제약은 학습하지 못..

BigData 2023.11.17
728x90
반응형