반응형

분류 전체보기 105

AI허브 데이터셋으로 Llama 3.2 모델 한국어 파인 튜닝을 위한 준비 작업 #4

오늘은 ollama 플랫폼으로 생성한 모델의 한국어 능력 상태를 확인해 보고 한글 파인 튜닝을 위한 준비 작업의 세 번째 이야기로 데이터셋 확보 방법을 정리해 보려 합니다.한국어 파인 튜닝을 위한 준비 작업 먼저, 지난 글("파인 튜닝을 위한 준비 작업 #2 - GGUF 파일을 Ollama에 이식하기")에서 ollama 플랫폼으로 생성한 모델명은 "llama3.2-1b_gguf2ollama:latest" 이었습니다. 위 모델과 편리한 대화를 위해서 UI 화면은 Docker를 이용해 보겠습니다. Docker 설치 및 ollama와의 연동 방법에 대해서는 이전 글 ("Meta AI의 Llama3.1 다운로드 및 설치 방법 그리고 WebUI 2of2")에서 자세하게 설명했습니다.   한국어 능력 확인이제부터 ..

Technology issues 2024.12.19

Transformer 라이브러리와 파인 튜닝을 활용한 자연어 처리 #3

오늘은 파인튜닝을 위한 준비 작업의 세 번째 이야기로, Transformers 라이브러리에 대해 이야기해 보려 합니다.Transformers는 Hugging Face에서 발표한 오픈소스 라이브러리입니다. 이 라이브러리는 다양한 자연어 처리 작업을 수행할 수 있는 강력한 도구로 자리 잡고 있으며 많은 연구자와 개발자들의 관심을 끌고 있습니다. 오늘 이러한 자연어 처리(NLP) 기술이 필수적인 요즘 이와 관련한 기술의 핵심에 있는 Transformers에 대해 정리해 보려 합니다.  Transformers 라이브러리Hugging Face의 Transformers 라이브러리는 다양한 자연어 처리 작업에 활용할 수 있는 모델과 도구를 한데 모아놓은 편리한 오픈소스 라이브러리입니다. 많은 사람들이 이 라이브러리를..

Technology issues 2024.12.16

파인 튜닝을 위한 준비 작업 #2 - GGUF 파일을 Ollama에 이식하기

오늘은 지난번 변환했던 GGUF 파일을 Ollama 플랫폼에 이식하는 방법에 대해 알아보겠습니다. GGUF 파일 변환 이유와 방법에 대해서는 바로 이전 글에서 자세히 다뤄봤으니, 오늘은 바로 다음 이야기를 시작하도록 하겠습니다. 파인 튜닝을 위해 GGUF 파일을 Ollama에 이식하기   Ollama 모델 생성하기Ollama 플랫폼에 gguf파일을 이식하기 위해서는 ollama 명령어 중 "create" 명령어를 사용합니다. 이 명령어의 형식에 대해 알아보기 위해 "-h" 옵션으로 살펴봅니다. 위에서 보면 "ollama create 모델명 [flags]"와 같은 형식의 명령어를 사용한다고 합니다. 여기에서 flags에 사용할 수 있는 옵션은 3종류가 있고, 그중 디폴트로 Modelfile을 사용한다고 합..

Technology issues 2024.12.11

Llama 3.2 모델 파인 튜닝 - 튜닝을 위한 준비 작업 #1 (GGUF 형식 변환)

오늘은 Llama 3.2 모델의 파인 튜닝을 위한 준비 작업인 인공지능 모델 다운 및 설치에 관해 이야기해 보려 합니다.   Llama 3.2 모델 파인 튜닝을 위한 준비 작업 이전 글에서 llama 3.1 모델을 다운로드하고 설치하여 실행하는 간단한 방법 중 하나로 Ollama 플랫폼을 이용하는 방법에 대해 이야기해 봤습니다. 이를 간단히 요약하자면, Ollama 홈페이지를 통해 Ollama 플랫폼을 자신의 PC에 설치를 하고 역시 홈페이지를 통해 Ollama에서 제공하는 인공지능 모델명을 확인한 후 윈도우 cmd를 열어서 "ollama run [모델명]"을 입력하여 다운로드 및 설치 후 실행을 동시에 수행하면 됩니다. 자세한 내용은 아래 이전 글을 확인해 보세요.https://paulsmedia.ti..

Technology issues 2024.12.05

트럼프 재선과 비트코인 급등에는 어떤 관계가 있을까?

오늘은 트럼프 재선 확정과 비트코인 급등과의 관계에 대해 살펴보겠습니다. 미국 대통령 한 사람 바뀐다고 비트코인이 급격하게 변경된다는 사실은 좀 문제가 있어 보이고, 또 사실 국내 이슈 때문에 너무 놓치고 지나치지 않았나 하는 생각으로 무엇이 이 변화의 원인이고 어떤 부분을 다시 검토해야 하는지 정리해 보려 합니다.  트럼프 재선과 비트코인 가격 급등의 관계2024년 하반기는 암호화폐 시장, 특히 비트코인 가격의 변동성이 그 어느 때보다도 컸습니다. 물론 아직 1개월이 남아 있지만 말이죠. 남은 12월에 또 어떤 변화가 있을지는 아무도 알 수 없습니다. 하여간, 트럼프 전 대통령의 재선이 확정된 이후, 비트코인 가격은 단기간에 급격히 상승하여 최고가는 거의 10만 달러에 근접했었습니다. 지금은 약간 내려..

&info/코인 2024.11.28

SFTlabel과 보상 모델 RMlabel 인공지능 훈련 데이터셋 이해하기

SFTlabel과 RMlabel은 일반적으로 기계 학습 및 인공지능 모델 훈련에서 사용되는 레이블링 된 데이터셋의 종류를 나타냅니다. 두 데이터셋은 각각 다른 목적을 가지고 있으며, 모델의 성능을 개선하는 데 중요한 역할을 합니다. 각각의 특징을 아래에 설명하겠습니다.  SFTlabel과 보상 모델 RMlabel 인공지능 훈련 데이터셋  SFTlabel (Supervised Fine-Tuning Label)SFTlabel은 지도 학습(Supervised Learning)을 통해 모델을 파인튜닝하기 위해 사용됩니다. SFTlabel은 주로 학습 데이터와 함께 답변을 포함하여, 모델이 특정 입력에 대해 올바른 출력을 생성하도록 훈련합니다.   구조`data_id`: 각 데이터 항목의 고유 ID.`data_c..

Technology issues 2024.11.20

양자 컴퓨팅이 필요한 이유와 초전도체가 중요한 이유

최근 핫한 기술 중 하나는 양자 컴퓨팅입니다. 이미 익숙한 분들도 계시겠지만, 양자 컴퓨터가 필요한 이유나 초전도체와의 관계에 대해서는 정리가 필요해 보여, 이번 글에서는 이러한 부분에 대해 최대한 쉽고 간략하게 정리해 보려합니다.  왜 양자 컴퓨팅이 필요할까?인공지능 기술의 발전과 함께 우리는 점점 더 복잡하고 방대한 문제들을 풀어야 하는 상황에 직면하고 있습니다. 기존 컴퓨팅 수준에서는 풀기에 벅찬 문제들을 신속하고 효율적으로 해결하기 위해서는 새로운 접근 방식이 필요해졌습니다. 바로 이 지점에서 양자 컴퓨팅이 큰 주목을 받고 있습니다. 양자 컴퓨팅은 고전적인 컴퓨터의 한계를 뛰어넘어, 훨씬 빠르고 강력한 성능을 제공할 수 있을 것으로 예상되기 때문입니다.    양자 컴퓨팅이 필요한 이유현재 우리가 ..

Technology issues 2024.11.14

Perplexity Pro와 ChatGPT 4o 창의적 대화부터 정보 탐색까지 서비스 비교

최근 인공지능 기술 특히 그중에서도 생성형 인공지능(AI) 기술 분야는 매우 빠르게 발전하고 있는 것 같습니다. 특히나 사람들이 미처 알지 못하는 사이에 일상에 상용화된 서비스도 상당히 증가하고 있는 모습입니다.생성형 AI(인공지능)은 사람의 질문에 답변을 생성하고 대화의 맥락을 이해하며, 다양한 응용을 통해 많은 이들의 관심을 받고 있는데요, 오늘은 생성형 AI의 두 대표적인 서비스, Perplexity Pro와 ChatGPT 4o에 대해 알아보고, 이 둘이 어떤 특징과 차이점을 가지는지 살펴보겠습니다.  Perplexity Pro와 ChatGPT 4o  Perplexity ProPerplexity Pro는 사용자가 질문을 던지면 신속하고 간결하게 답변을 제공하는 인공지능 서비스입니다. Perplexi..

Technology issues 2024.10.29

오래된 아파트에서 유무선 공유기로 와이파이(wifi) 확장하는 3가지 방법

오늘은 유무선 공유기 브랜드로 유명한 iptime의 유무선 공유기를 이용해서 와이파이 확장 방법에 대해 이야기해 보겠습니다. 개인적인 사정으로 오래된 아파트로 이사해서 보니 인터넷이 가장 문제가 되더군요. 각 방별로 콘센트 부근에 인터넷 케이블이 함께 매설되어 있어야 하는데, 구축 아파트들은 자체적으로 유선 라인을 연결하던지, 무선으로 연결해야만 하는 불편한 상황이더라고요.  각방을 케이블로 연결하는 것은 집안에 인터넷 케이블이 날아다니게 되니 피하고 싶고 와이파이를 이용해야 무선 깔끔하게 연결이 되니까요. 그런데, 여기서 또 문제가 생기더라고요, 아파트 평면에 따라 다르겠지만, 제가 주로 작업하는 방에서는 와이파이 수신 감도가 너무 형편없는 거예요. 방으로 인터넷 케이블이 연결되어 있으면 방 안에서 케..

Technology issues 2024.10.24

OpenAI의 GPT API와 Assistant API의 차이점, 사용자 요구에 맞춘 확장성과 유연성

OpenAI의 ChatGPT 외에도 GPT API와 Assistant API를 통해 다양한 AI 설루션을 제공하는 이유와 두 API의 차이점과 각 API가 기술적 요구에 어떻게 대응할 수 있는지를 살펴봅니다.  OpenAI의 GPT API와 Assistant API의 차이점  OpenAI가 ChatGPT 이외의 API를 제공하는 이유OpenAI는 ChatGPT라는 대화형 AI로 잘 알려져 있지만, 단지 대화형 AI에 국한되지 않고, GPT API와 같은 다양한 AI 설루션을 제공하고 있습니다. 이는 비즈니스와 기술 분야의 복잡하고 다양한 요구를 충족시키기 위해서입니다. 그렇다면, 왜 OpenAI는 ChatGPT 이외의 API를 제공할까요? 그 이유는 크게 세 가지로 나눌 수 있습니다.   맞춤형 AI 솔..

Technology issues 2024.10.21
반응형