워크플로우 노트

  • 홈
  • 태그

Realtime API 1

OpenAI Realtime API 연결 기준: 브라우저 음성은 WebRTC, 서버 로직은 WebSocket·sideband로 나눠야 한다

OpenAI Realtime API를 붙일 때 첫 질문은 "WebRTC가 좋나, WebSocket이 좋나"가 아니다. 마이크와 스피커가 어디에 있고, 표준 API key가 어디에 남아야 하며, 주문 조회나 정책 판단 같은 서버 로직을 누가 처리해야 하는지가 먼저다.2026-04-30 기준 OpenAI 공식 문서로 보면 기본 경계는 꽤 분명하다. 브라우저나 모바일에서 사용자가 음성으로 대화한다면 WebRTC부터 본다. 서버 worker가 음성 스트림과 이벤트를 직접 처리한다면 WebSocket이 맞다. 전화번호로 들어오는 통화는 SIP path다. 답변 생성 없이 실시간 자막만 필요하면 speech-to-speech session이 아니라 transcription session을 따로 봐야 한다.짧게 정리..

Model APIs 2026.04.30
이전
1
다음
더보기
프로필사진

워크플로우 노트

최신 AI 기술을 직접 재현하고 실무 적용까지 정리하는 블로그

  • 분류 전체보기 N
    • Model APIs
    • Agents And MCP
    • RAG And Document AI
    • Enterprise AI Systems
    • AI 툴 사용법
    • 업무 생산성
    • 자동화 실전 N

Tag

Agents And MCP, OpenAI, IMF, SCM, VDocRAG, ai agent, Responses API, ChatGPT, openAI API, Enterprise AI, GPT-5.4, Model APIs, AI Productivity, Docs Closure, Rebec, n8n, productivity, 업무 자동화, SAP, AI writing,

최근글과 인기글

  • 최근글
  • 인기글

공지사항

  • 이 블로그는 이렇게 운영합니다

Copyright © AXZ Corp. All rights reserved.

티스토리툴바