Gemini 모델에 대한 내용은 Gemini(인공지능 모델) 문서 참고하십시오.
대화형 인공지능 서비스의 목록 | ||
{{{#!wiki style="margin:0 -10px -5px; min-width:300px; min-height:calc(1.5em + 5px); word-break:keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" | 인공지능 컴패니언 | 이루다 2.0 · 강다온 · 허세중 · Neuro-sama · 라디안 · 냥아지 · 쿠로냥아지 |
페르소나 채팅 플랫폼 | Character.AI · RisuAI · CAVEDUCK · Myshell.ai · Rolp.ai · zeta · 티카 · Babechat.ai · SpeakEasy · 뤼튼 · GPTRPG | |
LLMs 대화형 | ChatGPT · Microsoft Copilot · Gemini · CLOVA X · 어니봇 · YouChat · Cue: · Pi · Le Chat · 삼성 가우스 | }}}}}}}}} |
<colbgcolor=#4991e6><colcolor=#fff> Gemini 제미나이 | |
개발사 | 구글[1] |
기능 | 대화형 인공지능 |
기반 언어모델 | LaMDA, PaLM 2, Gemini |
출시일 | 초기 베타 2023년 3월 21일안정화 베타 2023년 5월 15일리브랜딩 2024년 2월 8일 |
지원 언어 | 한국어 포함 47개 언어[2] |
서비스 | 일부 유료 |
라이선스 | Proprietary SW |
링크 | | | |
[clearfix]
1. 개요
구글의 대형 언어 모델(LLM)인 LaMDA와 PaLM, Gemini 을 기반으로 하는 인공지능 검색 엔진 서비스.[3] 2023년 3월 21일에 미국과 영국을 대상으로, 영어 버전으로 베타 테스트를 시작했고, 2023년 5월 15일부터는 PaLM 2 언어 모델을 탑재하고 한국어와 일본어를 추가해 전세계 180개국에서 세 가지 언어로 이용할 수 있는 안정화 버전을 출시했다. 2023년 7월 13일부터는 46개 언어로 이용이 가능하다.Gemini를 사용하려면 만 14세 이상의 Google 계정이 있어야 한다. #
2023년 12월 6일부터 Gemini 프로가 탑재된다고 밝혔다. #
2024년 2월 8일부터 Bard에서 Gemini로 리브랜딩하며 Gemini Ultra를 적용한 유료 서비스인 Gemini Advanced를 사용할 수 있게 되었다.
2. 특징 및 인터페이스
구글의 서비스인만큼, 구글 계정으로 로그인하여 사용할 수 있다. 기존 챗봇과 동일하게 프롬프트를 입력하여 질문하고 답변을 받는다. 프롬프트 입력란 오른쪽에 있는 마이크 사용 아이콘을 클릭하여 프롬프트 입력을 마이크로도 할 수 있다.Gemini는 한 질문에 대해 3가지의 답안을 제공한다. 원하는 질문의 답변에 충족하는 답안을 선택할 수 있고, 답안을 선택한 후 대화를 진행하면 선택한 답안으로 기억하며 변경할 수 없다. 다른 답안도 마음에 들지 않는다면, 오른쪽에 있는 답안 재생성 버튼을 클릭하면 답변을 다시 생성할 수 있다. 또한, 답변을 구글 독스 및 Gmail로 내보낼 수 있다. 대답 내보내기 버튼을 클릭 후 원하는 내보내기 형식을 선택하면 된다.
Python 언어와 관련한 답변에서는 Colab이나 replit[4]으로 코드를 바로 내보낼 수 있다. 코드를 내보낼 수 있다면, 내보내기 형식 중에 Colab으로 내보내기나 Replit으로 내보내기 버튼이 생성된다. 코드를 내보내고 Colab이나 Replit에서 Gemini가 제공한 코드를 바로 실행해볼 수 있다.
Gemini Advanced 전용 기능으로 제공하는 코딩 기능을 통해, Python 언어와 관련한 답변에서 생성된 코드를 인터페이스에서 바로 수정하고 실행할 수 있다. GPT-4처럼 생성된 코드가 원하는 대로 작동하는지 즉시 검증할 수 있다.
Gemini가 생성한 표를 구글 스프레드시트로도 내보낼 수 있다. Gemini가 제공한 표 하단에 Sheets로 내보내기 버튼을 클릭하면 구글 스프레드시트에 표의 데이터를 그대로 내보내 준다.
Google에서 검색 버튼을 클릭하면 질문 및 답변과 관련된 주제의 관련 검색어를 확인할 수 있다.
ChatGPT와 동일하게, 답변이 마음에 들지 않으면 대답이 마음에 들어요(👍) 또는 대답이 마음에 들지 않아요(👎) 아이콘을 클릭하여 평가를 전송할 수 있다.
2023년 5월 23일에 구글 검색을 활용해 이미지 자료를 가져오는 기능이 업데이트되었다. Gemini가 질문에 맞는 이미지를 가져오거나, 사용자가 직접 이미지 자료를 요청하여 이미지를 받을 수 있다.
2023년 7월 13일에는 답변을 TTS로 읽어주는 기능이 추가되었다. 답변의 오른쪽 상단 구석에 TTS 아이콘을 클릭하면 언어에 맞게 읽어준다. 이 외에도 많은 기능이 업데이트되었는데, 대화 목록과 질문 수정, 링크 공유 기능 등이 새롭게 추가되었고 이 기능들은 ChatGPT 내에 있는 기능들과 포맷이 같다.
2023년 9월 19일에는 답변을 구글 검색을 기반으로 정확성을 평가해주는 기능과 확장 프로그램이 추가되었다. [G] 버튼을 누르면 자동으로 답변의 내용을 구글로 검색한 후 신뢰할 만한 내용은 초록색으로, 관련 자료가 없거나 사실과 다른 내용은 빨간색으로 표시된다. [PC] 확장프로그램은 드라이브, 지메일, 구글지도, 유튜브등 구글의 서비스에 연동하여 질문을 하면 Gemini가 알아서 알맞는 확장을 고르고, 해당 확장을 답변에 사용하는 방식이다.
또한 이미지를 프롬프트와 같이 업로드하는 기능이 추가되어 Gemini에 이미지를 보여주고 답변을 요청할 수 있게 되었다. 예를 들면, 광화문 광장의 이미지를 업로드하고 어디인지 물었을 때 Gemini가 '서울의 광화문 광장으로 보인다'고 답하는 식이다.
2024년 2월 1일부터 Gemini Pro 기반 Gemini의 지원이 전 세계로 확대되어 Gemini가 지원되는 모든 언어새 창에서 열기에서 사용 가능해졌다. 이러한 업그레이드를 통해 Gemini가 이해, 요약, 추론, 브레인스토밍, 작문, 계획과 같은 작업을 더욱 잘 처리할 수 있게 되었다. 또한 영어로 이용할 경우 이마젠2(Imagen 2)를 이용하여 바드에서 그림을 생성할 수 있다.
2024년 2월 8일 기존의 Bard에서 Gemini로 리브랜딩하며 유료 멤버십을 필요로 하는 Gemini Advanced를 출시하였다.
최대 3년간 대화내용을 보관한다.[6]
2.1. 모바일 앱
2024년 4월 30일부터 한국에서 사용이 가능해졌다. 안드로이드에서는 플레이 스토어에서 앱을 다운로드하면 되며, 기존 구글 어시스턴트를 대체하게 된다.아직까지는 구글 어시스턴트 기능을 Gemini에 통합한 정도에 불과하다. 따라서 기존 구글 어시스턴트 기능은 그대로 유지되며[7], 구글 어시스턴트 동작 목록에 없는 명령에 한해 생성형 인공지능을 이용해 답변해준다. "오케이 구글"이라고 불러서 깨우는 기능도 그대로 들어갔다. [8]
Gemini 앱에서 어시스턴트 대신 Gemini를 사용하는 것으로 선택해야 쓸 수 있으며, 언제든지 기존의 구글 어시스턴트로 되돌릴 수 있다.
앱이 출시되며 생긴 가장 큰 장점은 웹페이지에 번거롭게 접속할 필요 없이 음성 명령 만으로 생성형 인공지능 답변을 들을 수 있다는 것이다.
다만 답변까지 걸리는 시간이 길고, 구글 어시스턴트에서는 되는 기능들도 Gemini에서는 제대로 되지 않는 등 아직 문제점이 많다.
2024년 11월 14일에 iOS용 Gemini 앱이 출시되었다.
3. 역사
3.1. 공개
구글에서 2023년 2월 6일 기사로 공개했는데, 몇 주 간의 테스트 후 자사 검색엔진에 추가하겠다고 발표했다.# ChatGPT가 2022년 11월 30일에 공개됐고, 마이크로소프트에서 GPT를 결합한 검색 엔진인 New Bing을 공개한다고 하자 구글에서도 그 대항마 격으로 내놓았다.3.2. 테스트 기간
구글이 미국과 영국의 일반 사용자를 대상으로 Gemini의 테스트를 시작했다. New Bing 초창기와 마찬가지로 Waitlist에 등록하고 구글로부터 승인 이메일을 받으면 사용해볼 수 있다. # 4월 23일부로 한국에서도 사용이 가능해졌으며, 5월 10일에 한국어와 일본어를 지원하게 되면서 한국어로도 사용이 가능하다.관련기사3.3. 리브랜딩
2024년 2월 8일, Bard의 명칭이 Gemini(제미나이)로 명칭이 변경하며 기능을 더욱 확장했다. # 또한 Gemini Ultra를 기반으로한 Gemini Advanced를 출시하였다. Gemini Advanced는 별도의 AI Premium Google One 요금제 구독하여야 이용가능하다.안드로이드와 iOS에서 이용가능한 Gemini앱을 출시하였으며 안드로이드는 Gemini앱을 직접 다운받으면 구글 어시스턴트를 대신하여 디지털 어시스턴트로 사용 가능하고 iOS는 기존 구글 앱을 업데이트 하여 사용가능하다.
4. 공개 후 평가
4.1. Bard
기존 구글이 가지고 있던 강점인 검색과 크롤링 속도를 그대로 살려 정보를 한 문장으로 취합하는 것 까지는 성공했으나, ChatGPT에 비해 서사가 붙거나 독창성을 요하는 부분에서는 상대적으로 부족하다는 평가가 많다. 이는 검색엔진을 탑재했기에 문장들이 명확하게 정립되지 않은 이유가 큰데 같이 검색엔진을 탑재한 New Bing과도 비슷한 문제이다.[9]시연회의 수모와 경쟁작들의 비판을 과하게 의식한 것으로 보인다. 독창성을 의도적으로 많이 제한해서 문제의 소지가 될 발언이 나올 여지를 아예 차단했고 정확하고 객관적인 답변만 제시하기 때문에 유저들 사이에서는 재미없다라는 반응도 많이 나오고 있다. 이전 ChatGPT나 빙 엔진보다 독창성과 참신함이 부족하고 AI 챗봇이 나온지 시간이 지났지만 새로운 바드만의 기능이 없기 때문이기도 하다.
다만 ChatGPT가 공개된 이후 성급하게 개발한 감도 있고, 본인들도 아직은 실험 단계라는 것을 주기적으로 강조하고 있기에 앞으로 어떻게 발전할지는 계속 지켜볼만한 내용이다. 한마디로 검색엔진으로서의 기능만 볼 때는 나름 쓸만한 수준은 맞지만, ChatGPT가 처음 공개됐을 때 수준의 파급력은 없다고 볼 수 있다.
2024년 2월, Bard의 명칭이 Gemini로 리브랜딩 되었다.
4.1.1. 긍정적 평가
- 빠른 검색 및 답변 속도
기존 구글 검색 엔진을 탑재했기에 속도만큼은 가히 탑이라고 볼 수 있다. New Bing은 검색에 시간이 조금 소요된 후 답변을 제공하는 한편, Gemini는 검색과 답변을 빠른 속도로 제공해 준다. 게다가 한번에 답안을 3개나 제공함에도 불구하고, 타 AI와 비교하면 속도가 매우 빠른 편에 속한다.
- 정확성
정확하지 않은 정보를 이야기할 때 ChatGPT처럼 없었던 사건을 실제 존재했던 것 처럼 소설을 쓰는 경우는 비교적 드물다. 다만 정보의 양이 부족하면 모른다고 하는 세팅이 상당히 보수적으로 설정됐는지 아는 것도 모른다고 하는 경우도 흔하다.
- 구글 검색 엔진을 기반으로 한 최신 정보 검색
세계 최고 수준의 검색 엔진을 기반으로 한 챗봇답게 최신 정보에는 가장 강하다. 1초단위로 실시간성이 지원되며, 또한 무료임에도 후술했듯 지연시간이 상당히 짧아 최신 정보에 매우 강하다.
- 비교적 다양한 기능
의외로 자체 기능이 꽤 많은데. 구글 렌즈를 이용한 이미지 질문이라던가, bing과 Gemini에만 있는 음성인식 기능, 유일하게 질문 후 답변을 출력하는 와중에도 질문을 할 수 있는 옵션도 지원하는등 의외로 사용자 친화성은 챗봇중에서 상당히 좋은편이다. - 이미지 구별 능력
글씨가 있는 이미지를 업로드하면 이미지에 있는 글자를 매우 정확하게 구별해낸다. 복잡한 수식을 구분할 수 있으며, 여려개의 작은 글자도 대부분 구별할 수 있다. Gemini와 비슷한 무료 챗봇 서비스인 copilot ai와 같이 이미지를 업로드하여도 이미지를 제대로 구별하지 못하는 경우와 대조되는 부분이다.
4.1.2. 부정적 평가
- 복잡성(Complexity)
비록 주어진 문제에 대해 정답을 도출하는 확률이 ChatGPT에 비해 높을지라도, 그러한 도출 과정의 간결성이 떨어진다. 더 간단한 풀이 방법을 활용하는 대신, 불필요한 풀이 과정이 중간에 들어가는 경우가 많다. 예시를 들면 5L 비커와 10L 비커가 있을 때 물 5L를 얻는 방법을 질문하면, 간단한 답변은 5L 비커에 물을 채운다이고 실제로 ChatGPT는 이렇게 답변한다. 반면 Gemini는 10L 비커에 물을 넣고, 이 물을 활용하여 5L 비커에 물을 가득 채운 후 물을 제거하라고 답변한다.
- 독창성
주어진 문장으로 인과관계에 맞게 새로운 문장을 구성하는 독창성은 가히 처참한 수준인데, 장점에서 말하던 속도와도 어느 정도 연관이 있어 보인다. ChatGPT와 Bing AI 같은 경우는 답변을 받은 후 실시간으로 문장을 구성하는 것을 보여주며 잘못된 정보는 격자 처리로 지우며 수정하는 걸 시각적으로 보여주는 반면, Gemini는 한 번에 3개 분량의 문장을 빠르게 보여주긴 하지만 그 문장들의 서사와 실질적으로 들어간 정보량이 현저히 낮다.
- 문장 이해력
여러 가지 가정을 입력해도, 예시를 잘 수용하지 못하며 주어를 제외한 서사에는 약한 모습을 보인다, 그러다 보니 이미 같은 답을 내놨지만 다른 내용을 발췌해 다른 답을 또 내는 불상사도 일어난다.
- 떨어지는 모듈 시너지
문장에 계산과 문법적 가정이 같이 들어간다면 잘 처리하지 못하는 모습을 보인다.
- 대화 연속성
앞서 대화했던 주제에 대하여 재언급하지 않고, 대화의 연장선상으로 추상적이게 같은 대화창에서 다시 물어볼 경우 엉뚱한 대답을 하는 횟수가 빈번하다. ChatGPT를 써온 사람에게는 크게 불편할 수도 있는 부분이다.
4.2. Gemini
현재는 베이스 모델 업그레이드, 구글에서 지원하는 기능 통합[10], 여러가지 다른 AI 클라우드 챗봇과 차이점을 두는 기능추가 등등 여러번의 개선을 거친 현재는 AI 클라우드 서비스 챗봇중에서 ChatGPT, Microsoft Copilot 다음 가는 수준 정도의 위치는 한다고 볼 수 있고, 기존의 장점이던 속도와 정확도, 정보 크롤링이 개선 후 부각되며 오히려 두 챗봇보다 우월한 부분도 존재하게 되어서, 용도만[11] 맞다면 두 챗봇과 더불어 용도에 맞게 돌려가면서 쓰기에는 충분한 성능을 가지게 되었다.[12]4.2.1. 긍정적 평가
4.2.2. 부정적 평가
5. 문제 및 사건사고
Gemini 앱의 문제 및 사건사고만 기록한 문단입니다. Gemini 앱을 이루는 Gemini 모델의 문제 및 사건사고에 대한 내용은 Gemini(인공지능 모델) 문서를 참고해 주세요. |
5.1. 시연 실패와 주가 폭락
2023년 2월 8일 프랑스 파리에서 있었던 기술 시연에서 제임스 웹 우주 망원경이 이룬 성과에 대해 묻자 최초로 태양계 외부 행성을 촬영했다는 잘못된 답변을 내놓는 등 문제점이 부각되어, 구글의 모회사인 알파벳의 주가가 폭락해 시가 128조 원이 순식간에 증발하는 데에 기여했다는 평가를 받았다. 또한 Microsoft Copilot[13] 역시 웹에서 정보를 가져와 답변하기 때문에 ChatGPT와의 차별점마저 퇴색되고 말았다.구글 내부에서도 바드에 대한 평가가 부정적으로 이어지자 선다 피차이는 직원들한테 하루 2~4시간 바드를 이용해달라고 요청했다. #
6. 기타
- 한국어 구글 검색결과 최상단에 대부분 나무위키가 있다보니 정보를 나무위키에서 긁어오는 경우가 흔하다(...) 특히 오타쿠적인 내용이나 나무위키에나 있을법한 마이너한 내용의 경우 이런 경향이 더 심하다.
- 일부 항목에서 사실과 다른 답변을 하는 경우도 잦은데, 대표적으로 왕징웨이의 일생에 대해 질문할 시 장제스 등의 다른 인물들과 혼동하여 답을 엉망으로 표시하는 경우가 있다. 특정 분야에서는 ChatGPT만큼 소설을 쓰는 경우도 적지 않은 편.
- 마이크로소프트의 코파일럿과 함께 생성AI 월 구독 모델 시장 형성으로 기대감을 모으고 있다.
[1] 정확히는 구글 자사의 인공지능을 총괄하는 부서, Google AI에서 개발했다.[2] https://support.google.com/gemini/answer/13575153?hl=ko[3] LaMDA와 PaLM 둘 다 엔비디아가 아니라 자사 칩셋인 TPU를 기반으로 학습되었다.[4] Colab과 동일한 온라인 개발 IDE 서비스이다.[PC] PC 전용 기능[6] OpenAI의 ChatGPT는 최대 30일까지만 보관한다.[7] 일부만 사용 가능[8] 사실상 구글 어시스턴트와 제미나이 묶음 상품.[9] 그러나 현재는 창의적 답변 옵션을 선택하고 여러번 질문을 이어가면 상당히 신뢰성 높은 답변을 얻을 수 있어, 속도를 빼면 New Bing에 완벽하게 밀리는 상태이다.[10] 구글 렌즈, 음성 인식, 위치 엑세스등[11] 속도, 정확성이 중요한 정보 크롤링[12] 다만 처음 시연시에 지적받던 "재미가 없다"는 의견인 새로운 정보를 창작하는 독창성 부분에서는 아직 상대적으로 부족하다고 평가받는다. 정확히는 새로운 정보를 창조는 해도 그 창조한 정보의 융통성이 떨어진다.[13] 다만 코파일럿 또한 오류가 있었다고 뒤늦게 알려졌다.