OpenAI 5

OpenAI GPT-5.4·Anthropic Claude Opus 4.7·Google Gemini 3.1 Preview/2.5 prompt caching 비교: 자동 할인보다 prefix·TTL·preview/stable을 먼저 봐야 한다

LLM API 비용을 줄이려고 prompt caching부터 보는 팀이라면 먼저 세 가지를 확인해야 한다. 반복되는 prefix가 몇 token인지, 다음 호출이 몇 분 뒤에 오는지, 할인되는 비용이 input인지 cache write인지 storage인지다. cache 지원이라는 한 줄만 보고 붙이면 생각보다 캐시가 안 먹거나, output token 비용 때문에 절감률이 작게 보이거나, TTL storage 비용이 계산에서 빠진다.2026-04-19 기준 current official docs로 보면 OpenAI, Anthropic, Google의 답이 꽤 다르다. 그리고 Google 쪽은 특히 latest preview와 stable을 나눠야 한다. 첫 발행본은 Gemini를 2.5 stable 기..

Model APIs 2026.04.19

OpenAI·Anthropic·LangSmith 문서를 같이 보면: AI 에이전트 eval은 왜 기능 데모보다 먼저 있어야 하나

에이전트 데모는 한 번만 잘 보이면 된다. 배포 전 eval은 그 반대다. 누락된 주문 번호, 잘못된 handoff, 정책 우회 요청, 중복 실행, 툴 인자 오류까지 걸러내야 한다. 2026-04-17 기준 current OpenAI, Anthropic, LangSmith 문서를 같이 읽으면 이 순서가 꽤 분명하다. 셋 다 멋진 데모보다 대표 trace, curated dataset, edge case, production feedback loop를 먼저 둔다.핵심만 먼저 적으면 이렇다.OpenAI는 behavior debugging 단계에서 trace grading이 workflow-level issues를 가장 빨리 찾는다고 적는다.Anthropic은 eval이 real-world task distr..

Agents And MCP 2026.04.17

OpenAI computer environment와 skills로 브라우저+셸 에이전트 만들기: tools만 켜면 안 되고 브라우저 하네스가 따로 필요하다

OpenAI에서 브라우저+셸 에이전트를 만들고 싶다면, 먼저 기대치를 바로 잡는 편이 낫다. skills는 반복 절차를 묶어 주는 도구이고, 브라우저를 대신 클릭해 주는 마법 버튼은 아니다. 실제로는 모델, shell loop, skills, 브라우저 하네스 네 조각이 각각 필요하다.먼저 핵심만 보면 이렇다.skills는 재사용 가능한 작업 절차를 묶는다.shell은 실제 명령 실행 루프를 만든다.브라우저 제어는 computer tool 또는 기존 Playwright/Selenium 하네스가 맡는다.그래서 browser + shell 에이전트는 기능 하나를 켜는 문제가 아니라, 역할이 다른 네 조각을 조립하는 문제에 가깝다.OpenAI 공식 문서가 지금 주는 것OpenAI는 2026년 3월 11일 eng..

Agents And MCP 2026.03.24

OpenAI Responses API에 MCP 서버 붙이기: 원격 도구 연결 최소 예제

Responses API에서 원격 MCP 서버를 붙이는 최소 형태는 생각보다 짧다. tools 배열에 type="mcp" 도구를 넣고 server_url 또는 connector_id, 필요하면 인증 정보와 require_approval 정책을 지정하면 된다. 내가 2026년 3월 13일에 직접 돌려본 결과, 공개 dmcp 서버는 mcp_list_tools -> mcp_call -> message 흐름이 깔끔하게 성공했고, OpenAI 문서용 MCP 서버는 연결은 성공했지만 중간 fetch_openai_doc 호출이 한 번 실패했다. 즉 MCP 연결 성공과 도구 호출 정확도는 같은 얘기가 아니다.먼저 요약하면 이렇다.최소 request는 responses.create(..., tools=[{"type":"..

Agents And MCP 2026.03.13

OpenAI Responses API로 가야 하는 이유와 Assistants API 종료 일정

새 프로젝트를 시작한다면 Assistants API보다 Responses API를 기준으로 잡는 편이 안전하다. OpenAI는 2025년 3월 11일 Responses API를 에이전트 빌딩의 새 기본 축으로 소개했고, 공식 migration 문서에서는 Assistants API 종료일을 2026년 8월 26일로 적어두고 있다. 이미 Assistants API를 쓰고 있다면 핵심 질문은 옮길까 말까가 아니라 무엇부터 옮길까에 가깝다.빠르게 판단하면 이렇다.새 프로젝트면 Responses API로 시작한다.기존 Assistants API 프로젝트는 2026년 8월 26일 이전 migration 계획이 필요하다.먼저 옮길 것은 tool/function integration이다.종료 일정 같은 사실값은 모델 ..

Model APIs 2026.03.12