반응형

구글이 AI 범용 모델 제미나이(Gemini)를 발표하며 주가가 약 5% 급상승했습니다. 얼마전 GPT 개선 모델 발표하면서 구글에서도 제미나이 관련 기사들이 몇 건씩 올라왔었는데, 제미나이 발표도 된 겸 내용 간략하게 정리해봅니다.

출처: 구글


제미나이(Gemini)란?

  • 구글에서 만든 범용 AI 모델. 처음부터 멀티모달로 설계되어 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 정보를 일반화 및 이해하고 조합해 활용할 수 있음

특징

아래 시연 연상이 주요 특징을  보여주니 간략히 보시면 됩니다

https://www.youtube.com/watch?v=UIZAiXYceBI&t=41s

  •  유연성
    • 데이터 센터, 모바일 기기 등 여러 환경 활용 가능
    • 1.0에서는 세 가지 크기로 최적화
      • 제미나이 울트라: 매우 복잡한 작업, 규모가 큰 모델
      • 제미나이 프로: 다양한 작업 확장
      • 제미나이 나노: 온 디바이스 작업

출처: 구글

  • 성능
    • 수학, 물리학, 역사 등 총 57개 주제를 복합적으로 활용해 문제 해결 능력을 평가하는 MMLU(massive multitask language understanding, 대규모 멀티태스크 언어 이해) 테스트에서 90.04%의 점수를 기록해 전문가 인력보다 높은 결과를 기록한 최초의 모델

출처: 구글, 텍스트 성능 비교
출처: 구글, 멀티모달 성능 비교

  • 멀티모달
    • 텍스트, 이미지, 오디오 등 다양한 형태 정보 동시 인식 및 이해
      • 특히 수학과 물리학 추론에 대한 설명 탁월
  • 코딩
    • 제미나이 울트라 모델은 코딩 작업 위한 업계 표준 벤치마크 HumanEval와 구글 자체 데이터셋 코딩 벤치마크 네추럴투코드(Natural2Code) 등 벤치마크에서 우수한 성적 보임
  • 책임성 및 안전 강조
    • 구글의 AI 원칙을 바탕으로 제미나이는 편향, 독극물, 사이버 공격 등 다양한 측면을 고려하여 포괄적 안전성 평가를 거침
    • 구글 리서치의 최첨단 적대적 테스트 기법 적용

코멘트

  • 사실 멀티모달에 대한 것은 이미 발표가 됐어서 별로 신기하지는 않음(시연 영상은 신기하긴 한데, 조작적으로 만들었을 가능성이 있어 모두 믿을 수는 없어 보임)
  • 성능에서 GPT4에 비해 소폭 상승했다고는 하나, 직접 사용해보지 않으면 얼마나 상승한지 모르고, 저 상승했다는 수치가 사용자 입장에서 체감되는 수치인지는 미지수
  • 오픈AI(OpenAI) 샘 알트만 해임 사건과 큐스타(Q-Star)에서 봤듯이 이미 AGI에 도달할 수 있는 기술을 개발했다(큐스타)는 오픈AI에 비해 한 발 늦는 느낌?

요약

  • 구글이 AI 범용 모델 제미나이 발표하며 주가 약 5% 상승
  • 대부분 평가 지표에서 GPT4 모델을 소폭 앞섬
  • 그래도 오픈AI에 비해 한 발 늦는다는 느낌은 없애지 못 함

 

반응형

+ Recent posts