최근 수정 시각 : 2025-02-11 13:06:01

Operator(OpenAI)


파일:OpenAI-black-wordmark-crop.svg파일:OpenAI-white-wordmark-crop.svg
{{{#!wiki style="margin:0 -10px -5px"
{{{#000,#fff {{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
{{{#000,#e5e5e5
<colkeepall> 제품군
서비스 ChatGPT, OpenAI(인공지능), Operator
모델 GPT-1, GPT-2, GPT-3(GPT-3.5), GPT-4(GPT-4 Turbo, GPT-4o, GPT-4o mini, GPT-4.5(개발 중)), GPT-5(개발 중)
o1(o1-preview, o1-mini, o1 pro mode), o3(o3-mini)
DALL·E, Codex, CLIP, Whisper, Voice Engine, Sora, SearchGPT, CUA
관련 인물
일론 머스크, 샘 올트먼, 미라 무라티, 일리야 수츠케버, 안드레 카파시, 그렉 브록만, 다리오 아모데이
관련 기업
마이크로소프트
}}}}}}}}}}}}}}} ||
생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
유니모달 모델 기반
<colkeepall> 텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI Novelist
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok
[[언어 모델|
언어모델
]] GPT · LLaMA · Gemma · Claude · Phi · Exaone · OpenELM · Qwen · DeepSeek
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind · DeepSeek
이미지 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Imagen · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
[[영상 인공지능|
영상
]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
[[모델링|
모델링
]] LATTE3D
오디오
소리
[[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA
멀티모달 모델 기반
대화형
+이미지
Exaone 3.5 · Samsung Gauss
+음성/이미지
GPT-4o · GPT-5 · Gemini · o1 · o3 · DeepSeek
+에이전트
Galaxy AI · Claude 3.5 Sonnet
행위
동작
[[지능형 에이전트|
에이전트
]] Apple Intelligence · Project Astra · Operator · Google Jarvis
[[인공지능 로봇|
체화
]] Tesla optimus · Google RT-X · Project Gr00t
}}}}}}}}}


Operator
오퍼레이터
<bgcolor=#fff> 파일:operator_logo.png파일:operator_logo.png
<colbgcolor=#000><colcolor=#fff> 분류 인공지능 에이전트
개발사 OpenAI
서비스 유료 (Pro 요금제 사용자 전용)
출시일 2025년 1월 23일 (초기 베타)
기반 Computer Using Agent(CUA)[1]
언어 영어
링크 파일:홈페이지 아이콘.svg | 소개 페이지

1. 개요2. 기능3. 작동 방식4. 한계점

[clearfix]

1. 개요

파일:operator_demo.gif
자체 브라우저를 사용하여 다양한 작업을 수행할 수 있는 인공지능 에이전트이다. 미국 ChatGPT Pro 요금제 사용자들을 대상으로 먼저 공개되었다.

2. 기능

웹 브라우저를 활용해 인터넷 상에서 할 수 있는 작업은 대부분 수행할 수 있다. 아래는 몇가지 사용 예시이다.
  • 설문지 작성
  • 식료품 주문
  • 자료 검색
  • 식당 예매
  • 티켓 예매
  • 밈 만들기 등

3. 작동 방식

클라우드 상의 자체 브라우저에서 CUA 모델 기반으로 작동한다.
비전 기능과 추론 기능을 바탕으로 스스로 마우스나 키보드 입력을 수행한다.

4. 한계점

  • CAPTCHA 및 봇 감지 통과 불가
    마우스 커서의 움직임이나 이전 사용 기록, 유저 에이전트값 등을 바탕으로 봇을 판별하는 대부분의 CAPTCHA나 기타 봇 감지 장치들을 통과하지 못한다. 따라서 Opertor를 위해 최적화되어 있지 않은 사이트의 경우 접속이 되지 않거나 작업을 수행하다 가로막히는 경우가 잦다.

[1] 에이전트 기능 특화 모델 #