밑바닥부터 만들면서 배우는 LLM 5장 독서 후기

힘센캥거루
2025년 12월 15일(수정됨)
2
13

오늘은 12월 14일이다.

사실 챌린지 기간은 이미 2주나 지나 버렸지만, 그렇다고 후기를 포기할 순 없었다.

이렇게 남기는 TIL이 나중에 피와 살이 되기 때문.

코드 자체보다는 의미에 집중해서 적어보려고 한다.

밑바닥부터 만들면서 배우는 LLM 5장 독서 후기-1

1. 모델의 손실 계산

GPT 모델을 만든 후에 어떤 방식으로 손실을 계산할지에 대한 내용이다.

GPT는 입력된 토큰을 바탕으로, 다음에 출력할 토큰의 확률을 계산한다.

이렇게 나온 확률들 중, 최상위의 확률을 가진 몇개의 토큰을 남기고 로그, 양수화 등을 거친 크로스 엔트로피 손실을 구한다.

밑바닥부터 만들면서 배우는 LLM 5장 독서 후기-2

크로스엔트로피 손실은 정답을 얼마나 확신했는지를 그대로 음수로 측정한 값이기 때문에, 평균 로그확률이 0에 가까워질수록 손실은 감소한다.

여기서 궁금했던 것은 로짓, 확률, 타깃 토큰확률, 로그 확률, 평균로그확률, 음의 평균 로그확률을 했는데 왜 모델의 정확도가 올라가는지였다.

이게 정답의 확률을 어떻게 높여줄 수 있을까?

밑바닥부터 만들면서 배우는 LLM 5장 독서 후기-3

알고보니 내가 로짓함수가 뭔지 잘 모르고 있었다.

쉽게 말하자면 모델은 실수 벡터인 로짓(logits)을 출력하고, softmax를 통해 이 점수들의 상대적 차이를 강조하여 확률 분포로 변환한다.

이 과정에서 큰 점수는 더 큰 확률을, 작은 점수는 거의 0에 가까운 확률을 갖게 된다.

그리고 확률은 0~1 사이의 값이고 log1 = 0 이므로 로그확률이 0에 가까울수록 정답에 가까운 토큰을 선택하게 된다.

따라서 손실(loss)은 정답 토큰의 로그확률이 0에 가까워지도록 모델 파라미터를 업데이트하게 만드는 신호다.

2. LLM 훈련과 디코딩 전략

밑바닥부터 만들면서 배우는 LLM 5장 독서 후기-4

이제 앞에서 했던 모든 과정을 통해 손실을 평가하고, 가중치를 업데이트 하는걸 반복하면 LLM을 훈련시킬 수 있다.

이때 정답에 가까운 토큰을 추론하기 위한 두 가지 전략이 인상적이었다.

만약 모델이 토큰을 선택할 때, 그리디 디코딩으로 확률이 높은 토큰만 선택한다면 응답의 다양성이 없어진다.

따라서 각 로짓을 숫자값(온도)로 나누어 응답의 다양성을 준다.

이것을 온도 스케일링이라고 한다.

또 하나는 탑-k 샘플링인데, 확률이 높은 k개의 토큰을 선택한 뒤 그 안에서 응답을 출력하도록 하는 것이다.

3. 후기

코드를 보면 파이토치와 함께 수학적 개념을 익혀야 하기에 눈이 자꾸 돌아갔는데, 이해하니 그리 어렵지 않다.

예전에 배웠던 손실 공식과 LLM에서의 손실 계산 방식이 조금 달라 배우는데 애먹기도 했다.

그래도 정말 깊이 알게 되어서 아이들에게 한번 가르칠만 한 것 같다.

아이들에게도 공식 자체보다는, 이해를 더할 수 있도록 하면 좋을 것 같다.

관련 글

2026년 동국대학교 미래사회 교원역량 강화 포럼 오프라인 참여 후기
2026년 동국대학교 미래사회 교원역량 강화 포럼 오프라인 참여 후기
어느 선생님이 재미있어 보이는 연수를 하나 소개시켜 주셨다.동국대에서 진행하는 AI 관련 연수였다.AI인 것도 좋인데 연수가 호텔에서?이건 무조건 가야 한다 싶었다.해당일 연수가 열리자 마자 신청해서 오프라인으로 참석하게 되었다.1. 앰배서더 서울 풀만 호텔처음에는 접...
글로벌숙련기술진흥원 특수분야 교육연수 - 목공 연수 후기
글로벌숙련기술진흥원 특수분야 교육연수 - 목공 연수 후기
아는 선생님이 인천에서 하는 숙박형 목공 연수가 있다고 하셨다.그리고 그 중에서도 김장회 명장님 수업을 꼭 들어야 한다며...!그래서 다 같이 신청하게 되었다.1. 신청 방법, 그리고 위치한국산업인력공단 글로벌숙련기술진흥원 직업훈련플랫폼 STEP을 아래에 링크해 둔다....
화이트햇 해커를 꿈꾸는 이들을 위한 해킹 입문서 해킹 맛보기 독서 후기
화이트햇 해커를 꿈꾸는 이들을 위한 해킹 입문서 해킹 맛보기 독서 후기
홈서버를 운영하면서 가장 중요한 것은 보안이었다.아무리 웹 사이트 기능을 마음에 들게 구축해도, 사방에서 들어오는 해킹에 한번 당하고 나니 무용지물이었다.지난번에 해킹으로 3일 동안 털릴때는 정말 무서웠다.그래서 해킹에 대해 공부해보기로 했다.유튜브에서 해킹 맛보기라는...
교사를 위한 교육연구 및 통계분석 연수 - 21~30차시 정리, 그리고 후기 등
교사를 위한 교육연구 및 통계분석 연수 - 21~30차시 정리, 그리고 후기 등
오늘은 교사를 위한 교육연구 및 통계분석 연구의 21~30차시에서 기억나는 내용과 후기를 남겨보려고 한다.1. logit(로짓)과 로지틱스 회귀분석처음에 로지틱스 회귀분석이라길래 뭔가 대단한것인줄 알았는데, 알고보니 로짓을 따라가는 선형 회귀분석이었다.예전에 LLM을 ...
교사를 위한 교육연구 및 통계분석 연수 - 13~20차시 R 실습 모음
교사를 위한 교육연구 및 통계분석 연수 - 13~20차시 R 실습 모음
이전에는 파이썬을 할 줄 아는데 굳이 R을 배워야 하는가에 대한 의문이 있었다.이번 연수를 들으며, 연구할 때 굳이 파이썬을 쓸 필요가 없다는 것을 깨닫게 되었다.파이썬 같으면 numpy로 선형회귀하고, 그래프 그리고, P value 구하고 다 해야 하지만 R은 lm과...
교사를 위한 교육연구 및 통계분석 연수 - 10~12차시 결정계수, 중다회귀분석 등
교사를 위한 교육연구 및 통계분석 연수 - 10~12차시 결정계수, 중다회귀분석 등
매일 1차시마다 후기를 썼는데, 생활기록부도 쓰고 이것도 하고 하다보니 매일 밤잠을 줄여야 했다.이렇게 하다가는 몸이 남아나지 않겠다는 생각에 몰아서 쓰기로 했다.1. 단순회귀모형 - 결정계수단순회귀모형에서 단순히 선형회귀 곡선이나, 계수만으로는 데이터의 형태를 알 수...

댓글을 불러오는 중...