기타 공부

OpenAI API 문서 훑기

하러어어러 2025. 4. 4. 02:18

1) Models

O series - STEM 문제를 위해 개발됨

O3-mini - low cost, reduced latency

O1 - high cost

gpt series - 챗

 

토큰 차이가 어느 정도일지 궁금..
reasoning model이 작동하는 방식

 

 

 

2) API types (endpoints)

url 방식이랑 라이브러리 방식이 있음.

 

여기서 좀 헤맸는데 responses API랑 chat completions API가 있음..

처음엔 둘이 뭐 장단점이 있나 싶었음. 크게 두 가지로 나누길래.

근데 그냥 chat completions가 예전 API endpoint고 (2026에 없앤다고 함)

responses 가 새로 나온 여러가지 기능을 통합한 endpoint인듯.

 

realtime이라는 구분되는 게 있는데 이건 실시간으로 주고 받도록 하는 건데 라이브러리 방식만 지원하는 거 같음. 지금은 관심 없어서 안 봄.

 

assistant라고 이거저거 파일 넣고 system input 미리 넣어주고 그대로 api처럼 쓸 수 있게 하는 기능도 있음.

좀 더 유저에 가까운 버전이 gpts인듯. 기능이 거의 비슷함

 

structured output이라고 정해진 json 형식으로 출력하게 할 수 있음.

 

3) Features

파인튜닝

10개 이상의 JSONL 데이터 셋 필요. 한 50-100개 넣고 돌려보고 결과를 보고 더 추가하라고 추천함.

api로도 할 수 있고 그냥 웹에서 드래그드랍으로 할 수도 있음.

여러 파라미터가 있는데

seed : 버전이라고 생각하면 됨. 학습 방법? 데이터 정렬 순서를 바꿔서 학습시킬 건데 그 정렬에 부여된 번호. 같은 시드면 아예 학습 결과가 똑같고, 시드마다 쪼끔씩 다른 거. 마인크래프트의 시드 같은 느낌.

method : supervised, DPO(direct preference optimization)

batch size : 한번 업데이트 할 때 얼마나 병렬적으로 크게 처리할 건지

learning rate : 한 번 업데이트 할 때 얼마나 크게 바꿀지. (너무 크게 바꾸면 overfitting 발생) overfitting : 아예 답변을 기억하고 그거에 맞춰서 똑같이 말하는 거.

epoch : 데이터를 전부 다 학습 시키는  사이클을 몇번 돌릴지. 역시 너무 많이 돌리면 overfitting

 

distillation

큰 모델에서 야무진 답변만 뽑아서 작은 모델이 그런 질문에 한해서 야무진 답변 할 수 있게 효율적으로 설계하는 그런 거 같은데 자세히는 안 읽었음.

 

retieval

외부 DB를 연결해서 검색하고 데이터를 이용할 수 있음.

계속 변하는 데이터셋을 이용할 때 유용할 듯. 복잡해보임.

 

evaluations

사람이, 아니면 인공지능 그 자체가 인공지능의 성능을 테스트 해볼 수 있음. 자세히는 안 읽어봄.

파인튜닝한 모델이나 assistant의 성능을 평가하는 거.

 

4) Various possible input types

이미지, 웹서칭, 텍스트 더미, 파일 다 넣을 수 있음

 

'기타 공부' 카테고리의 다른 글

매경 테스트 후기  (0) 2025.03.22
법학개론 독학사 시험 후기  (1) 2025.03.14