1) Models
O series - STEM 문제를 위해 개발됨
O3-mini - low cost, reduced latency
O1 - high cost
gpt series - 챗
2) API types (endpoints)
url 방식이랑 라이브러리 방식이 있음.
여기서 좀 헤맸는데 responses API랑 chat completions API가 있음..
처음엔 둘이 뭐 장단점이 있나 싶었음. 크게 두 가지로 나누길래.
근데 그냥 chat completions가 예전 API endpoint고 (2026에 없앤다고 함)
responses 가 새로 나온 여러가지 기능을 통합한 endpoint인듯.
realtime이라는 구분되는 게 있는데 이건 실시간으로 주고 받도록 하는 건데 라이브러리 방식만 지원하는 거 같음. 지금은 관심 없어서 안 봄.
assistant라고 이거저거 파일 넣고 system input 미리 넣어주고 그대로 api처럼 쓸 수 있게 하는 기능도 있음.
좀 더 유저에 가까운 버전이 gpts인듯. 기능이 거의 비슷함
structured output이라고 정해진 json 형식으로 출력하게 할 수 있음.
3) Features
파인튜닝
10개 이상의 JSONL 데이터 셋 필요. 한 50-100개 넣고 돌려보고 결과를 보고 더 추가하라고 추천함.
api로도 할 수 있고 그냥 웹에서 드래그드랍으로 할 수도 있음.
여러 파라미터가 있는데
seed : 버전이라고 생각하면 됨. 학습 방법? 데이터 정렬 순서를 바꿔서 학습시킬 건데 그 정렬에 부여된 번호. 같은 시드면 아예 학습 결과가 똑같고, 시드마다 쪼끔씩 다른 거. 마인크래프트의 시드 같은 느낌.
method : supervised, DPO(direct preference optimization)
batch size : 한번 업데이트 할 때 얼마나 병렬적으로 크게 처리할 건지
learning rate : 한 번 업데이트 할 때 얼마나 크게 바꿀지. (너무 크게 바꾸면 overfitting 발생) overfitting : 아예 답변을 기억하고 그거에 맞춰서 똑같이 말하는 거.
epoch : 데이터를 전부 다 학습 시키는 사이클을 몇번 돌릴지. 역시 너무 많이 돌리면 overfitting
distillation
큰 모델에서 야무진 답변만 뽑아서 작은 모델이 그런 질문에 한해서 야무진 답변 할 수 있게 효율적으로 설계하는 그런 거 같은데 자세히는 안 읽었음.
retieval
외부 DB를 연결해서 검색하고 데이터를 이용할 수 있음.
계속 변하는 데이터셋을 이용할 때 유용할 듯. 복잡해보임.
evaluations
사람이, 아니면 인공지능 그 자체가 인공지능의 성능을 테스트 해볼 수 있음. 자세히는 안 읽어봄.
파인튜닝한 모델이나 assistant의 성능을 평가하는 거.
4) Various possible input types
이미지, 웹서칭, 텍스트 더미, 파일 다 넣을 수 있음
'기타 공부' 카테고리의 다른 글
매경 테스트 후기 (0) | 2025.03.22 |
---|---|
법학개론 독학사 시험 후기 (1) | 2025.03.14 |