ReLearn: LLM 학습 제거 기술 분석

ReLearn: LLM 학습 제거 기술 분석 ReLearn: LLM 학습 제거 기술 분석 최근 대형 언어 모델(LLM)이 방대한 데이터를 학습하면서, 특정 정보를 제거해야 하는 필요성이 대두되고 있습니다. 예를 들어, 개인 정보 보호, 저작권 준수, 보안 유지 등의 이유로 특정 데이터를 잊도록 만드는 기법이 점차 필수적으로 자리 잡고 있는데요. 단순히 데이터를 수집하고 활용하는 단계를 넘어, 더 이상 …

GPT-2 모델을 사용자 정의 손실 함수와 함께 파인튜닝하는 방법

GPT-2 파인튜닝과 사용자 정의 손실 함수 적용 방법 GPT-2 모델을 사용자 정의 손실 함수와 함께 파인튜닝하는 방법 최근 자연어 처리(NLP) 분야에서는 GPT-2 모델을 다양한 목적으로 파인튜닝(fine-tuning)하는 연구가 활발히 진행되고 있습니다. 하지만 일반적인 교차 엔트로피 손실 함수가 아닌, 사용자가 직접 정의한 손실 함수를 적용하려면 어떻게 해야 할까요? 본 글에서는 GPT-2 모델을 파인튜닝하면서 N-그램 기반 손실 함수를 …

🔥 Python 메타클래스(Metaclass) 완전 정복! 초보도 쉽게 이해하는 개념 정리 🔥

Python 메타클래스란? 초보도 쉽게 이해하는 개념 정리 Python 메타클래스란? 초보도 쉽게 이해하는 개념 정리 파이썬을 배우다 보면 클래스는 자주 쓰는데, 메타클래스(Metaclass)라는 개념을 들으면 머리가 아파지죠? 🤯 하지만 걱정하지 마세요! 오늘은 중학생도 이해할 수 있도록 쉽고 재미있게 설명해드릴게요. 1️⃣ 클래스와 메타클래스의 차이 먼저 기본적인 개념부터 짚고 넘어가죠! 클래스(Class)란? 객체(Object)를 만들기 위한 ‘설계도’ 🏗️ 메타클래스(Metaclass)란? 클래스를 만들기 …

Python에서 삼항 연산자(ternary operator) 사용법 완벽 정리

Python에서 삼항 연산자 사용법 완벽 정리 | Ohchangss Python에서 삼항 연산자(ternary operator) 사용법 완벽 정리 Python을 배우다 보면 간결한 코드 작성을 위해 삼항 연산자를 활용하는 경우가 많습니다. 다른 언어에서는 condition ? true_value : false_value 형태로 사용되지만, Python에서는 다소 다른 형태로 제공됩니다. 이번 글에서는 Python의 삼항 연산자 개념과 활용법을 쉬운 예제와 함께 설명하겠습니다. 🚀 ✅ Python의 …

Python에서 if name == ‘main’: 의 역할은?

Python에서 if __name__ == ‘__main__’: 의 역할은? Python에서 if __name__ == “__main__” 의 역할은? Python에서 코드를 실행할 때 자주 등장하는 코드가 있습니다: if __name__ == “__main__”: print(“Hello, World!”) 이 코드는 무엇을 의미할까요? 🤔 그리고 왜 이렇게 작성해야 할까요? 1. __name__ 변수란? Python은 실행 중인 모듈(파일)의 이름을 __name__ 이라는 변수에 자동으로 저장합니다. 예를 들어, hello.py 파일이 …

LLM / MMLU 평가에 대해 (Redux,Pro) 지표 차이점 정리글

최근 Deepseek모델 발표후 모델의 성능과 관련하여 큰 파장이 있었다. 그와 관련하여 대중적으로 사용하는 평가지표들을 확인 해 보자! 평가지표에는 아래와 같이 다양한 사항들이 있다. 출처 : https://huggingface.co/deepseek-ai/DeepSeek-R1 Category Benchmark (Metric) Claude-3.5-Sonnet-1022 GPT-4o 0513 DeepSeek V3 OpenAI o1-mini OpenAI o1-1217 DeepSeek R1 Architecture – – MoE – – MoE # Activated Params – – 37B – – …

1. triton inference server 설치 및 테스트

triton inference server를 사용해보자 https://catalog.ngc.nvidia.com/orgs/nvidia/containers/tritonserver 트리톤 서버에 대해서 문서를 참조하면 좋을것 같다. 사용에 맞는 도커 컨테이너 뿐만 아니라 헬름차트토 함께 배포 한다. Triton 추론 서버란 무엇인가요? Triton Inference Server는 CPU와 GPU에 최적화된 클라우드 및 에지 추론 솔루션을 제공합니다. Triton은 원격 클라이언트가 서버에서 관리하는 모든 모델에 대한 추론을 요청할 수 있도록 하는 HTTP/REST 및 GRPC 프로토콜을 …

도커 데몬 설정 ( 윈도우즈 도커)

윈도우즈 도커로 도커 환경에서 빌드를 할때 이미지를 계속 도커 허브에서 가져오게 되거나 혹은 나중에 폐쇄망에서 도커 이미지를 가져와야될 경우 등이 생기면서, 도커 레포지토리를 구축하게 되었다. 넥서스환경에 도커 레포지토리를 구축했다. 이에 따라 윈도우즈에서 넥서스에 구축된 도커 레포지토리를 바라보면서 이미지를 pull/push하는 환경을 설정하게 됐다. 이미 도커를 사용하고 있다고 가정하고 작성하겠습니다. 도커 공식 홈페이지의 글을보니 자세히 나와있었다. 하지만 …

Anaconda 설치 및 Jupyter notebook 사용

파이썬으로 데이터분석, 머신러닝, 딥러닝등 코딩을 하려면 여러가지 개발환경이 있지만 그 중에서 가장 많이 사용하는 환경은 jupyter notebook 환경이라고 생각한다. 그럼 다양한 가상환경을 만들수 있는 아나콘다를 활용하여 가상환경을 만들고, 주피터 노트북을 설치하여 나만의 개발환경을 만들어 보자. 1. 아나콘다 설치 anaconda라고 구글에 치면 아나콘다 사이트가 나온다. https://www.anaconda.com/ 여기서 우측 위에 있는 다운로드를 클릭하여 다운로드를 들어가서 운영체제에 맞는 …

Recbole 입력 파라미터 알아보기 [추천시스템 라이브러리]

구성설정 모든 구성설정에는 5가지로 나뉜다. 이렇게 숫자로 표현해서 쓰니 뭔가 옛날에 데이터 분석 공부할때 데이터 분석방법론 같다는 생각이 갑자기 든다. 아무튼 구성설정을 설정 해야한다. 1. 환경설정(Environment Settings) 2. 데이터 설정 recbole에서는 데이터설정을 위해 recbole에 맞는 데이터셋을 만들어야한다. 데이터셋 만들기는 뒤에서 차근차근 또 살펴볼 예정이다. 환경설정, 데이터만 했는데 많은 글이 나와서. 이 뒤의 설정부분은 한번 끊고 …